【文献】
柳本 豪一,ニューラルネットワークを用いた文書類似度の推定,第27回全国大会論文集 [CD−ROM] 2013年度 人工知能学会全国大会(第27回)論文集,日本,社団法人人工知能学会,2013年 6月24日,p.1−2
(58)【調査した分野】(Int.Cl.,DB名)
前記機械学習部は、前記過去記事データの前記文字特徴データに加えて、前記過去記事データの画像データから取得した画像特徴データも記憶部に記憶した上で、前記過去記事データの文字データおよび画像データの入力を受け付ける第1層と、前記文字特徴データおよび前記画像特徴データに対応する第2層と、前記第2層の前記文字特徴データおよび前記画像特徴データを結合し、前記過去記事データごとの評価点を出力する第3層と、を入力側から順に接続したニューラルネットワークを形成し、
前記記事解析装置は、さらに、前記予測記事データの文字データおよび画像データを前記ニューラルネットワークの前記第1層に入力することで、前記第3層から出力された前記予測記事データの評価点を前記予測記事データの効果の予想データとして提示する効果予想部を有することを特徴とする
請求項1に記載の記事解析装置。
前記機械学習部は、前記過去記事データごとの評価点として、社会的ネットワークサービスに投稿された前記過去記事データに対する読者からの反応数を用いることを特徴とする
請求項2に記載の記事解析装置。
【発明を実施するための形態】
【0011】
以下、本発明の一実施形態について、図面を参照して詳細に説明する。
【0012】
図1は、記事解析装置1の構成図である。
記事解析装置1は、過去記事データ11と、予測記事データ12と、特徴DB13とを記憶部に記憶する。記事解析装置1は、機械学習部21と、効果予想部22と、改善計算部23と、形態素解析部31と、スコア計算部32と、スコア合計部33とを処理部として有する。
記事解析装置1は、CPU(Central Processing Unit)と、メモリと、ハードディスクなどの記憶手段(記憶部)と、ネットワークインタフェースとを有するコンピュータとして構成される。
このコンピュータは、CPUが、メモリ上に読み込んだプログラム(アプリケーションや、その略のアプリとも呼ばれる)を実行することにより、各処理部により構成される制御部(制御手段)を動作させる。
【0013】
過去記事データ11は、記事とその評価点とが対応付けられるデータであり、機械学習におけるラベル付きの教師データとして事前に入力される。過去記事データ11の記事とは、例えば、CM、看板、ポスターなどの広告を示す記事であり、社会的ネットワークサービス(SNS:social networking service)などのネットに公開されているものである。
過去記事データ11の評価点とは、公開された記事に対する読者からの評価(効果)を定量的に示すラベルである。この評価点は、例えば、ネットからのアクセスデータとして、記事へのアクセス数や、記事に対する読者からの反応数であるいいね数、リツイート数、リプライ数などである。なお、「いいね」とは、読者が好印象と判断した記事に対して、1クリック(1タッチ)で記事を評価する操作であり、アプリによっては「お気に入り」や「ファボ(Favorite)」とも呼ばれる。
または、評価点は、記事で紹介された商品に対する市場からの反応としての、売上げデータでもよい。
以下、
図2を参照して、記事解析装置1のうちの過去記事データ11以外の構成要素を説明する。
【0014】
図2は、記事解析装置1の処理を示すフローチャートである。
機械学習部21は、過去記事データ11を教師データとして機械学習し、その結果である回帰(Regression)の予測モデルを作成する。予測モデルは、例えば、過去記事データ11の特徴を示す単語(キーワード)として、特徴DB13に格納される(S11)。
なお、予測モデルは、例えば、入力層、中間層、出力層を順に接続し、それぞれの層を情報伝達させるニューラルネットワークとして構成される。中間層が多階層(複数階層)であるときは、機械学習部21は、ディープラーニングにより予測モデルを作成する。
【0015】
記事解析装置1は、予測記事データ12の入力を受け付ける(S12)。入力される予測記事データ12は、未公開の試作段階などで評価点が未定のものであり、予測モデルを用いて予測する対象の記事である。なお、予測記事データ12は、これから宣伝で使用しようとしている広告A案、広告B案、広告C案など複数のデータを事前に用意しておくことが望ましい。
【0016】
効果予想部22は、特徴DB13から読み出した予測モデルを用いて、S12で入力されたそれぞれの予測記事データ12の評価点を予想する(S13)。なお、評価点の高い記事だけでなく、評価点の低い記事も過去記事データ11として活用することが望ましい。これにより、効果予想部22は、例えば、読者に不快な単語を含む予測記事データ12を、「評価点の低い」と適切に予想することができる。
【0017】
改善計算部23は、過去記事データ11に記載される単語を特徴DB13から参照し、予測記事データ12の記事内容を改善する改善案を作成する(S14)。よって、今回入力された予測記事データ12を高評価の過去記事データ11に近づけるような改善案を作成するために、過去記事データ11として、過去にいいねを大量に獲得した記事など評価点の高い記事を事前に集めておくことが望ましい。
【0018】
記事解析装置1は、S13で予想した予測記事データ12の広告効果(評価点)と、S14で作成した予測記事データ12に対する改善案とを表示する(S15)。この表示により、ユーザは、最高点の評価点となる広告B案を採用するなどの意志決定を行ったり、広告B案に記載される単語を過去の人気記事に類似するように書き換えるなどの改善案を採用したりできる。つまり、ユーザは、評価点および改善案をもとに、売上に貢献する予測記事データ12を知ることができる。
なお、記事解析装置1は、効果予想部22の評価点と、改善計算部23の改善案とを同時に表示することとしたが、いずれか片方の表示だけでもユーザにとって有益である。よって、効果予想部22および改善計算部23のいずれか1つだけを備えた記事解析装置1として構成してもよい。
【0019】
図3は、過去記事データ11の文字データおよび画像データを対象とした、ニューラルネットワークの学習工程を示す説明図である。
図3の学習工程は、
図2ではS11の処理に該当する。
機械学習部21は、過去記事データ11を構文解析することで、文字データ101および画像データ102を抽出する。文字データ101として、過去記事データ11に記載されたテキストデータを抽出してもよいし、過去記事データ11に添付された音声データや動画データからテキストデータを音声認識により機械抽出してもよい。画像データ102は、1枚ずつの画像ファイルから構成されていてもよいし、過去記事データ11の動画データから抽出した画像ファイルの集合として構成されていてもよい。
【0020】
機械学習部21は、画像データ102を入力として、畳み込みニューラルネットワーク(畳込層)であるCNN(Convolutional Neural Network)データ112を作成する。そして、機械学習部21は、非特許文献1に記載されているように、CNNデータ112からスタイル情報を抽出し、そのスタイル情報を特徴DB13に登録する。スタイル情報は、画像データ102の学習結果であり、アドバイス画像(
図4の改善画像データ232)を生成するための画像の特徴情報である。
【0021】
機械学習部21は、文字データ101から抽出した単語頻度データ111を、特徴DB13に登録する(詳細は
図5)。機械学習部21は、単語頻度データ111と、CNNデータ112とを、全結合層データ121に結合させることで、ニューラルネットワークを作成する。機械学習部21は、全結合層データ121の出力先を記事効果データ131に対応付ける。
つまり、ニューラルネットワークの第1層(入力層)が文字データ101および画像データ102であり、第2層(中間層)が文字特徴データ(単語頻度データ111)および画像特徴データ(CNNデータ112)であり、第3層(出力層)が全結合層データ121である。
記事効果データ131とは、過去記事データ11に対応付けられている教師データのラベル(いいね数などの記事の評価点)である。機械学習部21は、このようにして生成したニューラルネットワークに対して、過去記事データ11を次々に入力(伝搬)させることで、ニューラルネットワークを学習させる。
【0022】
図4は、予測記事データ12の文字データおよび画像データを対象とした、ニューラルネットワークの推論工程を示す説明図である。
図4の推論工程は、
図2ではS13およびS14の処理に該当する。
効果予想部22は、入力された予測記事データ12を構文解析することで、文字データ201および画像データ202を抽出する。
効果予想部22は、抽出した文字データ201および画像データ202を
図3で作成したニューラルネットワークに入力することで、予測記事データ12に対するラベル(いいね数などの記事の評価点)を予想する。具体的には、効果予想部22は、文字データ201および画像データ202を、それぞれのデータ形式に合った中間層に入力する。
【0023】
これにより、特徴DB13から読み出された単語頻度データ111の層と、特徴DB13からスタイル情報として読み出されたCNNデータ112の層から、それぞれ全結合層データ121への情報伝搬が発生し、その結果が記事効果データ131と同様の形式である効果予想データ231へと伝搬する。よって、ユーザは、予測記事データ12がどれだけいいね数を得られるかなどの予測を知ることができる。
【0024】
さらに、改善計算部23は、
図6で後述するとおり、学習結果として特徴DB13に保存しておいた別の単語を文字データ201に適用した改善文字データ233を生成し、ユーザに提示する。
また、改善計算部23は、非特許文献1に記載されているように、学習結果として特徴DB13に保存しておいたスタイル情報を画像データ202に適用した改善画像データ232を生成し、アドバイス画像としてユーザに提示する。
例えば、過去記事データ11からいいね数が多い記事から、明るい配色のスタイル情報が抽出されたとする。そして、予測記事データ12の画像データ202からは暗い配色のスタイル情報が抽出されたとき、改善計算部23は、明るい配色のスタイル情報を参照して、画像データ202をより明るくした改善画像データ232を生成する。
【0025】
以上、
図3,
図4を参照して、文字データおよび画像データを対象としたニューラルネットワークを用いた予測記事データ12の解析処理を説明した。非特許文献1では、画像データを対象としたニューラルネットワークだけが構築されていた。本実施形態では、この画像データのニューラルネットワークに対して、新たに文字データの層を組み込むことで、文字データも画像データも含む予測記事データ12の予測処理を精度よく行うことができる。
【0026】
図5は、過去記事データ11の文字データを対象とした、特徴DB13の学習工程を示す説明図である。
図5の学習工程は、
図2ではS11の処理に該当する。
機械学習部21は、過去記事データ11から抽出した文字データ101をもとに、単語頻度データ111を抽出するように、形態素解析部31に指示する。形態素解析部31は、文字データ101から形態素解析により分割された各単語に対して、その出現回数(使用頻度)を集計して単語頻度データ111(詳細は
図7)を作成し、その単語頻度データ111を過去記事データ11の集合から学習する特徴データとして、特徴DB13に登録する。
【0027】
図6は、予測記事データ12の文字データを対象とした、特徴DB13の適用工程を示す説明図である。
図6の適用工程は、
図2ではS13およびS14の処理に該当する。
形態素解析部31は、
図5の学習工程と同様に、予測記事データ12の文字データ201に対して形態素解析により単語の集合に分割する。
スコア計算部32は、
図5の学習工程で得た単語頻度データ111と、形態素解析部31による予測記事データ12の単語の集合とをもとに、単語ごとにスコアリングする。このスコアとは、予測記事データ12に出現する各単語について、スコアが高いほど、別の単語に書き換えた方がよい度合いを示す。そして、改善文字データ233とは、書き換え先となる別の単語のリストである。
【0028】
さらに、スコア合計部33は、スコアリングの結果を予測記事データ12ごと(記事のページごと)に合計し、その合計値を全結合層データ121への入力とする。
図4で説明したように、効果予想部22は、全結合層データ121から効果予想データ231に対応付けることで、予測記事データ12ごとのいいね数などの記事の評価点を予想する。
【0029】
図7は、
図5および
図6の文字データに関する具体例である。
学習工程では、形態素解析部31は、過去記事データ11から単語頻度データ111を抽出する。単語頻度データ111は、「空前絶後が200回出現」、「浪漫が150回出現」、…などの単語ごとの出現頻度である。
適用工程では、まず、形態素解析部31は、予測記事データ12から単語の集合を抽出する。ここでは、前代未聞、ロマン、さっぱり、…などの単語が抽出されたとする。
【0030】
次に、スコア合計部33は、スコア計算部32が以下の式で計算した単語ごとのスコアを、予測記事データ12ごとに合計した集計スコアを求める。
(単語のスコア)=(予測記事データ12の単語)と(単語頻度データ111の単語)との類似度×(単語頻度データ111の使用頻度)
例えば、「前代未聞」と「空前絶後」との類似度が2.8なら、「前代未聞」のスコア=2.8×200=560となる。この単語ごとの集計スコアは、全結合層データ121に入力される。
【0031】
そして、改善計算部23は、予測記事データ12の単語ごとに、スコアが高い順に、単語頻度データ111の類似する単語のリスト(1位、2位、3位、…)を、改善文字データ233として抽出する。
例えば、今回試作した広告B案には、「前代未聞」という単語が記載されていた。しかし、人気の記事(過去記事データ11)には、「前代未聞」ではなく、意味が類似する「空前絶後」という単語が多く記載されていた。よって、改善計算部23は、「前代未聞」を高スコアの「空前絶後」や「画期的」などに書き換える旨の改善文字データ233をユーザに提示する。
これにより、広告B案を公開する前に「前代未聞」を「空前絶後」に書き換えさせることで、広告B案の趣旨を大きく変えることなく、広告B案の印象を改善できる。
【0032】
以上説明した本実施形態では、効果予想部22が過去記事データ11からニューラルネットワークを機械学習することで、予測記事データ12の効果を予測できる。ここで、過去記事データ11の学習データとして、いいね数などのSNSの口コミ効果の情報を用いることで、市場の評判を示すデータを手軽に入手できる。
さらに、改善計算部23が過去記事データ11から抽出した単語頻度データ111をもとに、予測記事データ12の単語を書き換える提案をすることで、予測記事データ12の内容に踏み込んだ改善をユーザに促すことができる。
【0033】
なお、本発明は前記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。
また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。
また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。また、上記の各構成、機能、処理部、処理手段などは、それらの一部または全部を、例えば集積回路で設計するなどによりハードウェアで実現してもよい。
また、前記の各構成、機能などは、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。
【0034】
各機能を実現するプログラム、テーブル、ファイルなどの情報は、メモリや、ハードディスク、SSD(Solid State Drive)などの記録装置、または、IC(Integrated Circuit)カード、SDカード、DVD(Digital Versatile Disc)などの記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。
【解決手段】記事解析装置1は、過去記事データ11の文字データ101として取得された各単語の出現頻度を集計した結果を、文字特徴データとして特徴DB13に記憶する機械学習部21と、入力された予測記事データ12の文字データ201として取得された各単語について、文字特徴データの単語との類似度が高いほど、かつ、文字特徴データの出現頻度が高いほど高得点とする評価関数を計算することで、各単語のスコアを計算し、予測記事データ12の各単語について、スコアが高い文字特徴データの単語を書き換え候補として、予測記事データ12の単語の書き換えを促す旨を提示する改善計算部23と、を有する。