特許第6048691号(P6048691)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許6048691不満抽出装置,不満抽出方法および不満抽出プログラム
<>
  • 特許6048691-不満抽出装置,不満抽出方法および不満抽出プログラム 図000002
  • 特許6048691-不満抽出装置,不満抽出方法および不満抽出プログラム 図000003
  • 特許6048691-不満抽出装置,不満抽出方法および不満抽出プログラム 図000004
  • 特許6048691-不満抽出装置,不満抽出方法および不満抽出プログラム 図000005
  • 特許6048691-不満抽出装置,不満抽出方法および不満抽出プログラム 図000006
  • 特許6048691-不満抽出装置,不満抽出方法および不満抽出プログラム 図000007
  • 特許6048691-不満抽出装置,不満抽出方法および不満抽出プログラム 図000008
  • 特許6048691-不満抽出装置,不満抽出方法および不満抽出プログラム 図000009
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6048691
(24)【登録日】2016年12月2日
(45)【発行日】2016年12月21日
(54)【発明の名称】不満抽出装置,不満抽出方法および不満抽出プログラム
(51)【国際特許分類】
   G06F 17/30 20060101AFI20161212BHJP
   G06F 17/27 20060101ALI20161212BHJP
【FI】
   G06F17/30 170A
   G06F17/27 640
【請求項の数】7
【全頁数】18
(21)【出願番号】特願2014-502205(P2014-502205)
(86)(22)【出願日】2013年2月25日
(86)【国際出願番号】JP2013054761
(87)【国際公開番号】WO2013129311
(87)【国際公開日】20130906
【審査請求日】2016年1月7日
(31)【優先権主張番号】特願2012-41395(P2012-41395)
(32)【優先日】2012年2月28日
(33)【優先権主張国】JP
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成23年度 総務省「ライフサポート型ロボット技術に関する研究開発」委託研究、産業技術力強化法第19条の適用を受ける特許出願
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100079005
【弁理士】
【氏名又は名称】宇高 克己
(72)【発明者】
【氏名】石澤 善雄
(72)【発明者】
【氏名】細見 格
(72)【発明者】
【氏名】定政 邦彦
【審査官】 田中 秀樹
(56)【参考文献】
【文献】 特開2008−209978(JP,A)
【文献】 特開2010−204864(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
G06F 17/27−17/28
G06Q 30/00−30/08
(57)【特許請求の範囲】
【請求項1】
文の集合から、評価対象および該評価対象に係る評価表現と、該評価対象とは異なる比較対象および該比較対象に係る評価表現を含む1つの文または、評価対象および該評価対象に係る評価表現を含む文と、該評価対象とは異なる比較対象および該比較対象に係る評価表現を含む文とからなる連続する2つの文を不満文候補として抽出する不満文候補抽出部と、
前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する極性判定部と、
前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出する不満文抽出部と
を備えることを特徴とする不満抽出装置。
【請求項2】
請求項1記載の不満抽出装置において、
前記不満文抽出部は、
前記評価対象に係る評価表現の極性の程度を示す値と比較対象に係る評価表現の極性の程度の値との差を求め、
前記極性値の差が所定の閾値以上であれば、前記不満文候補が不満文であると判定する
ことを特徴とする不満抽出装置。
【請求項3】
請求項1〜2何れかに記載の不満抽出装置において、
前記不満文抽出部は、
更に、前記比較対象に係る評価表現が肯定評価表現又は中立評価表現であれば、前記不満文候補が不満文であると判定する
ことを特徴とする不満抽出装置。
【請求項4】
請求項1〜3何れかに記載の不満抽出装置において、
前記不満文候補抽出部は、
更に、前記評価対象と前記比較対象の間に逆接表現を含む文を不満文候補として抽出する
ことを特徴とする不満抽出装置。
【請求項5】
請求項1〜4何れかに記載の不満抽出装置において、
前記評価対象の上位語を特定し、該上位語の下位語を前記比較対象と特定する比較対象特定部
を更に備えることを特徴とする不満抽出装置。
【請求項6】
評価対象入力部と、不満文候補抽出部と、極性判定部と、不満文抽出部とを備える不満抽出装置を用いる不満抽出方法であって、
評価対象入力部が、文字列で表される評価対象を入力し、
不満文候補抽出部が、文の集合から、評価対象および該評価対象に係る評価表現と、該評価対象とは異なる比較対象および該比較対象に係る評価表現を含む1つの文または、評価対象および該評価対象に係る評価表現を含む文と、該評価対象とは異なる比較対象および該比較対象に係る評価表現を含む文とからなる連続する2つの文を不満文候補として抽出し、
極性判定部が、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定し、
不満文抽出部が、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出する
ことを特徴とする不満抽出方法。
【請求項7】
評価対象入力部と、不満文候補抽出部と、極性判定部と、不満文抽出部とを備える不満抽出装置に情報処理を実行させる不満抽出プログラムであって、
評価対象入力部が、文字列で表される評価対象を入力する評価対象入力処理と、
不満文候補抽出部が、文の集合から、評価対象および該評価対象に係る評価表現と、該評価対象とは異なる比較対象および該比較対象に係る評価表現を含む1つの文または、評価対象および該評価対象に係る評価表現を含む文と、該評価対象とは異なる比較対象および該比較対象に係る評価表現を含む文とからなる連続する2つの文を不満文候補として抽出する不満文候補抽出処理と、
極性判定部が、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する極性判定処理と、
不満文抽出部が、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出する不満文抽出処理と
を不満抽出装置に実行させることを特徴とする不満抽出プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
不満抽出装置,不満抽出方法およびプログラムに係り、ブログやインターネット掲示板のような、評価対象製品の使用者によって書かれた文書の中から、評価対象製品の改善に有用な不満を抽出することのできる不満抽出装置,方法およびプログラムに関する。
【背景技術】
【0002】
近年、製品の購入者や使用者が、ブログやインターネット掲示板などで、購入製品や使用製品に関する事実や意見を大量に発信するようになってきた。このような購入者や使用者が製品に対して持った意見には、「使いやすくて良い」などの肯定的意見から「画面が暗くて見にくい」などの否定的意見(不満)や「画面の解像度を上げて欲しい」などの要望など、様々な意見がある。それらの意見の中には商品の改善に有用な意見も含まれている。
【0003】
そのような改善に有用な意見として、「キーを押しやすくして欲しい」といった直接的要望がある。直接的要望に関しては、非特許文献1に記載されているような「欲しい」などの要望を表す表現を手がかりにすることで、直接的要望を抽出することが出来る。
【0004】
一方、不満の中にも、「携帯電話Aは使えない」といった愚痴レベルの不満から、「携帯電話Aには機能αがあるのに、携帯電話Bに機能αがないのはおかしい」などの製品の改善に有用な不満まで、様々な不満が含まれている。
【0005】
すなわち、「携帯電話Aは使えない」という不満では、製品開発者はどの点を改善すればよいのか分からない。一方、「携帯電話Aには機能αがあるのに、携帯電話Bに機能αがないのはおかしい」という不満から、携帯電話Bの開発者は、携帯電話Bに機能αを追加することを検討できる。機能αは携帯電話Aにおいて実現されており、携帯電話Bに機能αを追加することに技術的な課題はほとんどない。このような不満は、間接的要望でもある。
【0006】
この様に、評価対象製品の改善に有用な不満を抽出することができれば、製品開発者は、製品開発に直ちにフィードバックすることができる。
【0007】
また、使用者の不満ではないが、「携帯電話Cもいいけど、携帯電話Dは更に素晴らしい」などのように、携帯電話Cのユーザは不満を持っていないが、より優れた携帯電話Dが存在することを知っている場合がある。この場合、ユーザにとって携帯電話Dの方が携帯電話Cより優れていると感じており、携帯電話Cのユーザが持っている潜在的不満とみなせるので、このような不満も改善への期待を表した不満として、商品開発にフィードバックできれば、商品の開発者は、消費者の期待により沿った商品の開発を行うことができる。
【0008】
改善への期待を表した不満とは、評価対象の機能や性能やデザインなどに比べてより優れた比較対象が存在し、評価対象が比較対象より劣っている旨が書かれた不満と定義する。このような不満が、評価対象製品の改善に有用な不満である。
【0009】
以下、評価対象製品の改善への期待を表した不満と、そうでない不満について例示し、その理由を示す。
○評価対象製品への改善の期待を表した不満の例:
「パソコン用音楽再生ソフトで再生できるのに、ポータブルオーディオに取り込むと再生できない。」(ポータブルオーディオで再生可能になる改善を期待)
「G社製スマートフォンOSでフリック入力できるが、A社製スマートフォンOSではフリック入力できないのが残念。」(A社製スマートフォンOSでもフリック入力できるような改善を期待)
「B社製スマートフォンの液晶画面は綺麗だが、A社製スマートフォンは汚い。」(A社製スマートフォンの画面が、B社製スマートフォンの液晶画面と同等の品質になる改善を期待)
「C社製スマートフォンの画面は綺麗だが、B社製スマートフォンの画面は文句のつけようがない。」(C社製スマートフォンの画面が、B社製スマートフォンの画面と同等の品質になる改善を期待)
○評価対象製品への改善の期待を表した不満でない例とその理由:
「2日目に正常に充電できなくなり、赤いランプが点滅状態になった。」(理由:事実のみで、意見ではない。)
「使い物にならないスイング設定はとても残念。」(理由:どうなれば使い物になるかわからないので、製品開発にフィードバックできない。)
「画面の自動リフレッシュができるようになったらいいのになぁ。」(理由:要望であり、実現可能か技術的課題の検討が必要である。)
「D社製スマートフォンの画面はイマイチだが、E社製スマートフォンの画面は酷過ぎる。」(理由:E社製スマートフォンの画面の改善を期待するが、D社製スマートフォンの画面と同等の品質に改善しても使用者は満足しない。)
【0010】
ところで、従来技術として、いくつかの不満抽出装置や関連する装置が提案されている。
【0011】
特許文献1の情報処理装置(不満抽出装置)は、様々な不満の中から、他のサービス(例えば、Q&Aサイト)に利用可能な不満として、デメリットや不利益な出来事に関する不満を見分けて抽出する。
【0012】
特許文献1の情報処理装置は、文書データベースから文書を取得し、改善動作を表す語を抽出し、文書集合データベースから取得した文書から該改善動作の対象を抽出し、該改善動作を表す語と該改善動作の対象を表す語の共起頻度を求め、改善動作を表す語と改善動作の対象を表す語の共起頻度を取得し、該改善動作の対象の語を否定、中立、肯定のいずれかの評価極性に分類し、否定的な改善動作の対象を現す語を不満として出力する。
【0013】
さらに、Q&Aサイトにユーザより投稿された質問を取得し、該質問の中から不満に一致する語を含む質問を選択し、不満に一致する語を含む質問を取得し、Q&Aサイトから該質問に対応する回答を取得して、推薦ページとして出力する。
【0014】
具体的には、まず、商品の効果を説明する際に記述される「この商品は、運動不足を解消してくれます」などの説明文から、改善動作を表す語「解消」と否定的動作対象を表す語「運動不足」と利益を表すモダリティを表す語「解消してくれます」の3つを抜き出す。
【0015】
次に、文書集合を用いて、動作を表す語と動作の対象を表す語の共起頻度と、動作を表す語と利益を表すモダリティを表す語の共起頻度を求め、2つの共起頻度の積が大きい動作を改善動作として抽出する。
【0016】
その後、文書集合から、抽出した改善動作の対象を特定し、改善動作と改善動作の対象の共起頻度から改善動作の対象の極性を判定し、最後に、極性が否定の改善動作の対象を「不満」として抽出する。
【0017】
ユーザが記述したテキストから不満と一致する語を抽出し、Q&Aサイトに投稿された質問の中から不満を含む質問を選択し、その質問に紐付く回答をユーザに提示する。
【0018】
特許文献2の比較評価検出装置は、複数の対象を比較し、それらに認められる異同や優劣について述べた比較評価を表明する文字列から構成された比較評価表明箇所を検出する。
【0019】
特許文献2の比較評価検出装置は、予め、比較評価表明箇所を抽出するパターンを格納しておく。次に、テキストを取得し、特定の単位の文字列に区切り、その文字列毎に形態素解析を行い、形態素解析結果を取得する。そして、前記形態素解析結果と前記抽出パターンを照合する。そして、前記対象を示す文字列、該対象を相対的に評価する際の比較対象を示す文字列、該対象を評価する際に着目している属性を示す文字列、該対象に関する評価の程度を示す文字列、該対象に関する評価を示す文字列、のいずれかを含む組み合わせを比較評価表明箇所として検出する。
【0020】
特許文献3の極性推定システムは、評判情報の評価極性を推定するものである。これを利用すれば、評価極性の大きさにより、どちらの製品が評価されているかを推定できる。
【0021】
特許文献3の、極性が既知である評判情報に基づいて、属性表現における良いイメージ又は悪いイメージ等の表現の使われ方や否定度合いを加味して、評価極性を推定でき、評価極性が未知である評価表現に対して極性を推定することができる。すなわち、今までに蓄積された評判情報に基づいて、対象物や属性表現、評価表現の極性度の偏りを加味して評価極性を推定することができる。そして、対象に対する評価極性の大きさの統計的平均を、その対象の評価値として求め、評価値の大きい対象をユーザに評価されている対象とする。
【先行技術文献】
【特許文献】
【0022】
【特許文献1】特開2010‐204865号公報
【特許文献2】特開2008‐209978号公報
【特許文献3】国際公開第2008/075524号
【非特許文献1】金山 博,那須川哲哉、要望の対象の同定、言語処理学会第14回年次大会、Mar. 2008
【発明の概要】
【発明が解決しようとする課題】
【0023】
上記従来技術には、以下のような課題があった。
【0024】
特許文献1の情報処理装置は、商品の効果の説明をする文から改善動作を表す語を基に不満を抽出しており、商品を開発した企業が狙った効果に対する不満を抽出することはできるが、ブログやインターネット掲示板などの購入者や使用者の視点に基づいて書かれた文書から評価対象製品の改善に有用な不満を抽出することは難しかった。
【0025】
例えば、ある携帯電話に対して、購入者や使用者が「同じメーカが作っているけど、携帯電話Aではゲームがプレイできるのに、携帯電話Bではゲームがプレイできない」という不満をブログやインターネット掲示板などに書いたとしても、携帯電話に対して「ゲームのプレイが可能です」などの説明が商品の効果として書かれていない場合、購入者や使用者が書いた評価対象製品の改善に有用な不満を抽出することはできない。
【0026】
特許文献2の比較評価検出装置は、「液晶テレビの画質はブラウン管の画質よりとても良い。」など、ある評価軸の中で複数の対象間を相対的に比較する場合には有効だが、絶対評価が難しかった。すなわち、特許文献2の比較評価検出装置は、「携帯電話Dの操作性は、携帯電話Cよりはまだ良い。」といった文も検出する。「携帯電話Dの操作性は、携帯電話Cよりはまだ良い。」の表現には、言外に、「使用者は、携帯電話Cの操作性も携帯電話Dの操作性も満足できる基準を超えていないと考えている。」との前提が含まれている。
【0027】
一方、「B社製スマートフォンの液晶画面は綺麗だが、A社製スマートフォンは汚い。」との表現には、「使用者は、B社製スマートフォンの液晶画面については基準を超えていると考えているが、A社製スマートフォンの液晶画面については基準を超えていないと考えている。」との使用者の基準に基づく絶対評価が含まれている。
【0028】
しかし、「携帯電話Dの操作性は、携帯電話Cよりはまだ良い。」といった相対評価では、使用者が満足できる基準が判らないため、製品開発者はどの程度改善すればよいのか判断できない。
【0029】
特許文献3の極性推定システムは、評価対象と比較対象を比較して評価しない場合でも、評判情報を抽出する。たとえば、使用者が携帯電話Eより携帯電話Fが優れていると思っていたとしても、比較評価する必要がない場合は、購入者や使用者は「携帯電話Eはいい。」といった評価を書く。これではどちらの携帯電話の方が優れているということがわからない。このような評価が混じると、評判情報を収集し評価表現の大きさの統計的平均を求めたとしても、その結果は大きな誤差を含んだものになってしまう。
【0030】
本発明は上記課題を解決するものであり、ブログやインターネット掲示板のような、評価対象製品の使用者によって書かれた文書の中から、評価対象製品の改善に有用な不満を抽出することのできる不満抽出装置,方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0031】
上記課題を解決する本発明は、文の集合から、評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する不満文候補抽出部と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する極性判定部と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出する不満文抽出部とを備えることを特徴とする不満抽出装置である。
【0032】
上記課題を解決する本発明は、不満抽出装置が、文字列で表される評価対象を入力し、文の集合から、評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出し、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定し、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出することを特徴とする不満抽出方法である。
【0033】
上記課題を解決する本発明は、文字列で表される評価対象を入力する評価対象入力処理と、文の集合から、前記評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する不満文候補抽出処理と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する極性判定処理と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出する不満文抽出処理とを不満抽出装置に実行させることを特徴とする不満抽出プログラムである。
【発明の効果】
【0034】
本発明によれば、ブログやインターネット掲示板のような、評価対象製品の使用者によって書かれた文書の中から、評価対象製品の改善に有用な不満を抽出することができる。製品開発者は、抽出した不満を製品開発に直ちにフィードバックすることができる。
【図面の簡単な説明】
【0035】
図1】不満抽出装置の機能ブロック図(第1実施形態)
図2】極性辞書の構造
図3】不満抽出装置の処置内容を示すフローチャート
図4】不満抽出装置の機能ブロック図(変形例)
図5】不満抽出装置の処置内容を示すフローチャート(第2実施形態)
図6】不満抽出装置の処置内容を示すフローチャート
図7】上位下位関係辞書の構造
図8】不満抽出装置の機能ブロック図(変形例)
【発明を実施するための形態】
【0036】
<第1実施形態>
〜構成〜
第1実施形態の構成について説明する。図1は、第1実施形態に係る不満抽出装置の機能ブロック図である。不満抽出装置は、文の集合を取得して格納する文集合取得部101と、改善する製品である評価対象を文字列として入力する評価対象入力部102と、評価対象に対応する比較対象を入力する比較対象入力部103と、文の集合から、評価対象と評価対象に係る評価表現および比較対象と比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する不満文候補抽出部104と、評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する極性判定部105と、評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、不満文候補が不満文であるか否かを判定し、不満文を抽出する不満文抽出部106と、抽出された不満文を格納する不満記憶部107を備えている。
【0037】
文集合取得部101は、対象製品の購入者や使用者によって書かれた、ブログやインターネット掲示板や口コミサイトなどから、文の集合を取得し、格納する。
【0038】
評価対象入力部102は、キーボードなどにより入力された文字列を評価対象として入力する。本実施形態では、一例として「A社製スマートフォン」を評価対象とする。
【0039】
比較対象入力部103は、キーボードなどにより入力された文字列を比較対象として入力する。本実施形態では、たとえば、「B社製スマートフォン」や「C社製スマートフォン」を比較対象とする。
【0040】
不満文候補抽出部104は、文集合取得部101に格納された文の集合から、評価対象に係る評価表現および比較対象に係る評価表現を検索する。評価表現か否かを、評価表現辞書108を参照して、判定する。評価対象と評価対象に係る評価表現および比較対象と比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する。
【0041】
たとえば、以下の(a)〜(j)の各文を含む文の集合を想定する。評価対象に係る評価表現および比較対象に係る評価表現を〔 〕で示す。
(a)B社製スマートフォンの場合、電子マネー機能を〔使うことができる〕が、A社製スマートフォンでは電子マネー機能を使うことが〔できない〕。
(b)B社製スマートフォンのようにFM送信機能を〔利用できる〕のだが、A社製スマートフォンではFM送信機能を〔利用できない〕。
(c)A社製スマートフォンは〔汚い〕が、B社製スマートフォンは画面が〔綺麗〕。
(d)A社製スマートフォンの画面は〔良い〕。B社製スマートフォンの画面は〔文句のつけようがない〕。
(e)C社製スマートフォンの画面は〔良い〕。A社製スマートフォンの画面は〔文句のつけようがない〕。
(f)A社製スマートフォンの画面も〔いい〕。C社製スマートフォンの画面も〔いい〕な。
(g)C社製スマートフォンの画面は〔イマイチ〕だけど、A社製スマートフォンの画面は〔酷過ぎる〕。
(h)A社製スマートフォンは2日目に正常に〔充電できなく〕なり、赤いランプが点滅状態になった。
(i)A社製スマートフォンで、画面の自動リフレッシュができるようになったらいいのになぁ。
(j)携帯電話は折りたたみ式があるのに、スマートフォンではできない。
【0042】
すなわち、不満文候補抽出部104は、(a)〜(g)の各文を不満文候補として抽出する。
【0043】
なお、(h)(i)においては、比較対象と比較対象に係る評価表現がないため、(j)においては、更に評価対象と評価対象に係る評価表現もないため、候補から除外される。
【0044】
極性判定部105は、評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する。評価極性とは、評価表現が肯定表現であるか否定表現かの特性である。評価表現の極性を、極性辞書109を参照して、判定する。
【0045】
図2は、極性辞書109の構造を示す図である。「[サ変動詞]できる」などは、「利用できる」などの「利用(サ変動詞)」+「できる」のパターンを表している。極性を−1〜1の実数とし、1に近いほど肯定的であり、−1に近いほど否定的であるものとする。極性=0は中立評価を示す。すなわち−1≦極性<0は否定評価を示し、0<極性≦1には肯定評価を示す。上記候補(a)〜(g)に含まれる評価表現の極性を判定する。
(a)〔使うことができる〕=0.6,〔できない〕=−1.0
(b)〔利用できる〕=0.6,〔利用できない〕=−1.0
(c)〔汚い〕=−0.9,〔綺麗〕=0.9
(d)〔良い〕=0.5,〔文句のつけようがない〕=1.0
(e)〔良い〕=0.5,〔文句のつけようがない〕=1.0
(f)〔いい〕=0.5,〔いい〕=0.5
(g)〔イマイチ〕=−0.3,〔酷過ぎる〕=−1.0
【0046】
不満文抽出部106は、比較対象に係る評価表現が肯定評価表現又は中立評価表現である場合(Pc≧0)、評価対象に係る評価表現の極性の程度を示す値Ptと比較対象に係る評価表現の極性の程度の値Pcとの差(Pc−Pt)を求める。
(a)Pc−Pt=0.6−(−1.0)=1.6
(b)Pc−Pt=0.6−(−1.0)=1.6
(c)Pc−Pt=0.9−(−0.9)=1.8
(d)Pc−Pt=1.0−0.5=0.5
(e)Pc−Pt=0.5−1.0=−0.5
(f)Pc−Pt=0.5−0.5=0・0
【0047】
なお、(g)においては、比較対象「C社製スマートフォン」に係る評価表現〔イマイチ〕が否定評価(=−0.3<0.0)であるため、除外される。これは、A社製スマートフォンの画面をC社製スマートフォンの画面と同等の品質になる改善したとしても、使用者は〔イマイチ〕と感じ、満足しないためである。
【0048】
極性差(Pc−Pt)は、使用者の改善への期待を表す指標である。この指標値が大きくなれば、改善の効果が大きくなる。閾値は、明確な優劣差を示せる値である。
【0049】
不満文抽出部106は、極性差(Pc−Pt)が所定の閾値(例えば0.4)以上となる(a)〜(d)の各文が不満文であると判定する。
【0050】
なお、(e)においては、極性差(Pc−Pt)は負数となっている。これは、評価対象が比較対象より優れていることを意味し、改善点はない。また、(f)においては、極性差(Pc−Pt)は閾値未満となっており、評価対象と比較対象との間に優劣差はなく、改善点はない。
【0051】
不満記憶部107は、不満文(a),(b),(c),(d)を格納する。
【0052】
製品の開発者は、不満記憶部107にアクセスし、不満を参照することによって、製品改善に直ちにフィードバックする。
【0053】
〜動作〜
図3は、不満抽出装置の処置内容を示すフローチャートである。フローチャートを用いて、不満抽出装置の動作を説明する。
【0054】
まず、対象製品の購入者や使用者によって書かれた、ブログやインターネット掲示板や口コミサイトなどから、文の集合を取得し、格納する(ステップ1)。たとえば、上記の(a)〜(j)の各文を含む文の集合を取得する。
【0055】
一方、キーボードなどにより入力された文字列を評価対象として入力する(ステップ2)。たとえば、評価対象として「A社製スマートフォン」を入力する。また、キーボードなどにより入力された文字列を比較対象として入力する(ステップ3)。たとえば、比較対象として「B社製スマートフォン」,「C社製スマートフォン」を入力する。
【0056】
文の集合から、評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する(ステップ4)。たとえば、(a)〜(g)の各文を不満文候補として抽出する。
【0057】
次いで、評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する(ステップ5)。評価表現の極性は極性辞書109を参照する。
【0058】
そして、比較対象「B社製スマートフォン」,「C社製スマートフォン」に係る評価表現が肯定評価表現又は中立評価表現であり、評価対象「A社製スマートフォン」に係る評価表現の極性の程度を示す値と比較対象に係る評価表現の極性の程度の値との差が所定の閾値以上である、不満文候補(a)〜(d)の各文が不満文であると判定し、不満文を抽出し(ステップ6)、格納する(ステップ7)。
【0059】
これらの処理は、不満抽出装置のプログラムにより実行される。
【0060】
〜効果〜
本実施形態の不満抽出装置により、優れた評価の比較対象と劣った評価の評価対象が対比表現で記載された不満文を抽出できる。たとえば、上記(a)〜(c)の各文のような不満文には、「使用者は、比較対象については基準を超えていると考えているが、評価対象については基準を超えていないと考えている」との絶対評価が黙示的に記載されている。
【0061】
すなわち、製品開発者は、比較対象で評価された諸機能を評価対象に付加すれば、使用者の満足する基準を超える改善をすることができる。たとえば、A社製スマートフォンに電子マネー機能,FM送信機能,音楽ファイル再生機能を付加し、画面の画質を改善すればよい。当該機能は比較対象であるB社製スマートフォンにおいて既に実現しており、評価対象に当該機能を追加することに技術的な課題はほとんどない。
【0062】
また、本実施形態の不満抽出装置は、潜在的な不満が記載されている不満文も抽出できる。たとえば、上記(d)の各文のような不満文では、使用者は、評価対象であるA社製スマートフォンに直接的な不満を感じておらず基準は超えているが、比較対象であるB社製スマートフォンの方が優れていると感じており、A社製スマートフォンの画面をB社製スマートフォンと同等の品質になる改善をすれば、使用者はより満足する。当該機能は比較対象であるB社製スマートフォンにおいて既に実現しており、評価対象に当該機能を追加することに技術的な課題はほとんどない。
【0063】
このように、製品開発者は、使用者の不満を製品改善および新製品開発に直ちにフィードバックすることができる。
【0064】
〜変形例〜
本実施形態では、不満文候補抽出部104は、文集合取得部101に格納された文の集合から、評価対象に係る評価表現および比較対象に係る評価表現を検索する。評価表現か否かを、評価表現辞書108を参照して、判定する。評価対象と評価対象に係る評価表現および比較対象と比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する。
【0065】
変形例としてさらに、評価対象と比較対象の間から逆接表現を検出してもよい。図4は、変形例に係る不満抽出装置の機能ブロック図である。
【0066】
不満文候補抽出部104は、文集合取得部101に格納された文の集合から、評価対象と比較対象の間から逆接表現を検出する。逆接表現か否かを、逆接表現辞書110を参照して、判定する。評価対象と評価対象に係る評価表現、比較対象と比較対象に係る評価表現、および逆接表現を含む1つの文または連続する2つの文を不満文候補として抽出する。
【0067】
上記(a)〜(j)の各文において、逆接表現を《 》で示す。
(a)B社製スマートフォンの場合、電子マネー機能を〔使うことができる〕《が》、A社製スマートフォンでは電子マネー機能を使うことが〔できない〕。
(b)B社製スマートフォンのようにFM送信機能を〔利用できる〕の《だが》、A社製スマートフォンではFM送信機能を〔利用できない〕。
(c)A社製スマートフォンは〔汚い〕《が》、B社製スマートフォンは画面が〔綺麗〕。
(d)A社製スマートフォンの画面は〔良い〕。B社製スマートフォンの画面は〔文句のつけようがない〕。
(e)C社製スマートフォンの画面は〔良い〕。A社製スマートフォンの画面は〔文句のつけようがない〕。
(f)A社製スマートフォンの画面も〔いい〕。C社製スマートフォンの画面も〔いい〕な。
(g)C社製スマートフォンの画面は〔イマイチ〕《だけど》、A社製スマートフォンの画面は〔酷過ぎる〕。
(h)A社製スマートフォンは2日目に正常に〔充電できなく〕なり、赤いランプが点滅状態になった。
(i)A社製スマートフォンで、画面の自動リフレッシュができるようになったらいいのになぁ。
(j)携帯電話は折りたたみ式がある《のに》、スマートフォンではできない。
【0068】
すなわち、不満文候補抽出部104は、(a)〜(c),(g)の各文を不満文候補として抽出する。その他の構成及び動作は本実施形態と同様である。
【0069】
これにより、精度よく不満文候補を抽出することができる。その結果、不満文を精度よく抽出できる。
【0070】
他の変形例について説明する。
【0071】
本実施形態では、上記(g)のような分を除外するため、不満文抽出部106は、比較対象に係る評価表現が肯定評価表現又は中立評価表現である場合(Pc≧0)のみ、作動する。A社製スマートフォンの画面をC社製スマートフォンの画面と同等の品質になる改善したとしても、使用者は〔イマイチ〕と感じ、満足しないためである。本実施形態ではこのような不満は有用でないとしているが、場合によっては有用となることもあり得る。その場合は、不満文抽出部106は、(Pc≧0)の条件を解除して、作動する。
【0072】
本実施形態では、明確な優劣差を抽出するため、不満文抽出部106は、極性差(Pc−Pt)が閾値以上の不満文候補について不満文であると判定している。しかし、極性辞書109をより正確にすることにより、精度よく優劣差を抽出できれば、極性差(Pc−Pt)>0の不満文候補について不満文であると判定してもよい。
【0073】
<第2実施形態>
図5は、第2実施形態に係る不満抽出装置の機能ブロック図であり、図6は、第2実施形態に係る不満抽出装置の処置内容を示すフローチャートである。
【0074】
第1実施形態においては、比較対象入力部103が、キーボードなどにより入力された文字列を比較対象として入力する(ステップ3)が、第2実施形態においては、比較対象特定部111が上位下位関係辞書112を参照して評価対象に対応する比較対象を特定している(ステップ8)。
【0075】
図7は、上位下位関係辞書112の構造を示す図である。「電話」の下位語として「スマートフォン」,「携帯電話」,「固定電話」が存在する。「スマートフォン」の下位語として「A社製スマートフォン」,「B社製スマートフォン」,「C社製スマートフォン」などが存在する。逆に、「A社製スマートフォン」,「B社製スマートフォン」,「C社製スマートフォン」の上位語として、「スマートフォン」が存在し、「スマートフォン」の上位語として、「電話」が存在するということもできる。
【0076】
上位下位関係を構築するには、高度言語情報融合フォーラムで配布している上位下位関係抽出ツールなどを利用することができる。
【0077】
「A社製スマートフォン」,「B社製スマートフォン」,「C社製スマートフォン」は、上位語「スマートフォン」を同じくする同種語である。
【0078】
比較対象特定部111は、評価対象の上位語を特定し、この上位語の下位語を比較対象と特定する。たとえば、評価対象「A社製スマートフォン」の上位語として、「スマートフォン」を特定し、「スマートフォン」の下位語である「B社製スマートフォン」,「C社製スマートフォン」を比較対象として特定する。そして、評価対象を表す語からN形態素以内に比較対象を表す語が出現するか否かを確認し、比較対象を抽出する。ここで、Nは共起する範囲を表し、Nは任意の値とする(例えば、N=100と設定)。
【0079】
比較対象特定部111により、比較対象を入力する手間を省くことができる。さらに、比較対象特定部111は、比較対象が評価対象の近傍に出現することを要求するため、不満文候補をより精度よく抽出することができる。
【0080】
〜変形例〜
図8は、第2実施形態の変形例に係る不満抽出装置の機能ブロック図である。
【0081】
変形例において、第2実施形態における文集合取得部101が文集合取得部113となり、評価対象入力部102がない。
【0082】
文集合取得部113は、対象製品の購入者や使用者によって書かれた、評価対象「A社製スマートフォン」に関するブログやインターネット掲示板や口コミサイトなどから、文の集合を取得し、格納する。
【0083】
比較対象特定部111は、上位下位関係辞書112を参照して評価対象に対応する比較対象を特定する。たとえば、「B社製スマートフォン」や「C社製スマートフォン」を比較対象とする。
【0084】
その他の構成及び動作は第2実施形態と同様である。
【0085】
評価対象「A社製スマートフォン」に関するブログやインターネット掲示板や口コミサイトなどでは、評価対象に関する話題であることが前提であり、評価対象が省略されていることも多い。変形例において、文集合取得部116は、評価対象「A社製スマートフォン」に関するブログやインターネット掲示板や口コミサイトなどから、文の集合を取得することで、評価対象の記載が省略されていると推測することができる。
【0086】
また、文集合取得部113により、評価対象を入力する手間を省くことができる。
【0087】
<付記>
上記実施形態の一部または全部は、以下の様に付記のようにも記載されうるが、以下に限定されない。
【0088】
本発明は、文の集合から、評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する不満文候補抽出部と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する極性判定部と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出する不満文抽出部とを備えることを特徴とする不満抽出装置である。
【0089】
このように構成された不満抽出装置により、優れているとの評価の比較対象と劣っているとの評価の評価対象が対比表現で記載された不満文を抽出できる。不満文には、「使用者は、比較対象については基準を超えていると考えているが、評価対象については基準を超えていないと考えている」との絶対評価が黙示的に記載されている。
【0090】
すなわち、製品開発者は、比較対象で評価された諸機能を評価対象に付加すれば、使用者の満足する基準を超える改善をすることができる。当該機能は比較対象である比較対象において既に実現しており、評価対象に当該機能を追加することに技術的な課題はほとんどない。
【0091】
また、本発明の不満抽出装置は、潜在的な不満が記載されている不満文も抽出できる。すなわち、使用者は、評価対象に直接的な不満を感じておらず基準は超えているが、比較対象の方が優れていると感じている場合、潜在的な不満となる。製品開発者は、比較対象で評価された諸機能を評価対象に付加すれば、使用者はより満足する。当該機能は比較対象である比較対象において既に実現しており、評価対象に当該機能を追加することに技術的な課題はほとんどない。
【0092】
このように、製品開発者は、使用者の不満を製品改善および新製品開発に直ちにフィードバックすることができる。
【0093】
本発明の不満抽出装置において、さらに好ましくは、前記不満文抽出部は、前記評価対象に係る評価表現の極性の程度を示す値と比較対象に係る評価表現の極性の程度の値との差を求め、前記極性値の差が所定の閾値以上であれば、前記不満文候補が不満文であると判定する。
【0094】
これにより、比較対象と評価対象との間に明確な優劣差がある不満文を、より精度よく抽出できる。
【0095】
本発明の不満抽出装置において、さらに好ましくは、前記不満文抽出部は、更に、前記比較対象に係る評価表現が肯定評価表現又は中立評価表現であれば、前記不満文候補が不満文であると判定する。
【0096】
比較対象が基準を超えていない場合、比較対象で評価された諸機能を評価対象に付加する改善をしても、使用者は満足しない。このような評価対象製品の改善に有用でない不満を除外することができる。
【0097】
本発明の不満抽出装置において、さらに好ましくは、前記不満文候補抽出部は、更に、前記評価対象と前記比較対象の間に逆接表現を含む文を不満文候補として抽出する。
【0098】
本発明の不満抽出装置において、さらに好ましくは、前記評価対象の上位語を特定し、該上位語の下位語を前記比較対象と特定する比較対象特定部を更に備える。
【0099】
本発明は、不満抽出装置が、文字列で表される評価対象を入力し、文の集合から、評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出し、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定し、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出することを特徴とする不満抽出方法である。
【0100】
本発明の不満抽出方法において、さらに好ましくは、前記不満文を抽出するステップでは、前記評価対象に係る評価表現の極性の程度を示す値と比較対象に係る評価表現の極性の程度の値との差を求め、前記極性値の差が所定の閾値以上であれば、前記不満文候補が不満文であると判定する。
【0101】
本発明の不満抽出方法において、さらに好ましくは、前記不満文を抽出するステップでは、更に、前記比較対象に係る評価表現が肯定評価表現又は中立評価表現であれば、前記不満文候補が不満文であると判定する。
【0102】
本発明の不満抽出方法において、さらに好ましくは、前記不満文候補を抽出するステップでは、更に、前記評価対象と前記比較対象の間に逆接表現を含む文を不満文候補として抽出する。
【0103】
本発明の不満抽出方法において、さらに好ましくは、前記評価対象の上位語を特定し、該上位語の下位語を前記比較対象と特定する。
【0104】
本発明は、文字列で表される評価対象を入力する評価対象入力処理と、文の集合から、前記評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する不満文候補抽出処理と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する極性判定処理と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出する不満文抽出処理とを不満抽出装置に実行させることを特徴とする不満抽出プログラムである。
【0105】
本発明の不満抽出プログラムにおいて、さらに好ましくは、前記不満文抽出処理では、前記評価対象に係る評価表現の極性の程度を示す値と比較対象に係る評価表現の極性の程度の値との差を求め、前記極性値の差が所定の閾値以上であれば、前記不満文候補が不満文であると判定する。
【0106】
本発明の不満抽出プログラムにおいて、さらに好ましくは、前記不満文抽出処理では、更に、前記比較対象に係る評価表現が肯定評価表現又は中立評価表現であれば、前記不満文候補が不満文であると判定する。
【0107】
本発明の不満抽出プログラムにおいて、さらに好ましくは、前記不満文候補抽出処理では、更に、前記評価対象と前記比較対象の間に逆接表現を含む文を不満文候補として抽出する。
【0108】
本発明の不満抽出プログラムにおいて、さらに好ましくは、前記評価対象の上位語を特定し、該上位語の下位語を前記比較対象と特定する比較対象特定処理を更に不満抽出装置に実行させる。
この出願は、2012年2月28日に出願された日本出願特願2012−041395を基礎とする優先権を主張し、その開示の全てをここに取り込む。
【符号の説明】
【0109】
101 文集合取得部
102 評価対象入力部
103 比較対象入力部
104 不満文候補抽出部
105 極性判定部
106 不満文抽出部
107 不満記憶部
108 評価表現辞書
109 極性辞書
110 逆接表現辞書(変形例)
111 比較対象特定部(第2実施形態)
112 上位下位関係辞書(第2実施形態)
113 文集合取得部(変形例)
図1
図2
図3
図4
図5
図6
図7
図8