【文献】
小田桐 優理,コンテンツプラットホームにおける機械学習、データセット公開・モデル公開による産学の発展,電子情報通信学会誌,一般社団法人電子情報通信学会,2017年01月01日,第100巻 第1号,pp.25〜31
(58)【調査した分野】(Int.Cl.,DB名)
前記第1判定部により前記第2コンテンツが不適切であると判定された場合、前記第2コンテンツの掲載順位を下げるまたは掲載対象から除外するように、前記第2コンテンツの掲載順位を決定する順位決定部と、
前記順位決定部により決定された掲載順位に基づいて、前記第1コンテンツと前記第2コンテンツとを含むウェブページを生成するページ生成部と、
を備える、請求項1に記載の情報処理装置。
前記第2コンテンツと、前記第1判定部による前記第2コンテンツが不適切であるか否かを示す判定結果を示すラベルと、の関係を学習して、判定モデルを生成する学習部をさらに備える、
請求項1から5のいずれか一項に記載の情報処理装置。
【発明を実施するための形態】
【0010】
以下、図面を参照し、本発明の情報処理装置、情報処理方法、およびプログラムの実施形態について説明する。情報処理装置は、一以上のプロセッサ(コンピュータ)により実現される。情報処理装置は、コンテンツに対するコメントを閲覧したユーザにより報告された内容に基づいて、このコメントが不適切なコメントであるか否かを判定する。情報処理装置は、このコメントが不適切なコメントであると判定した場合、このコメントの掲載順位を下げるか、あるいは掲載対象から除外する。
【0011】
図1は、サービス提供装置1(情報処理装置)の利用環境を示す図である。サービス提供装置1は、ネットワークNWを介して、一以上の端末装置Tと接続され、このネットワークNWを介して互いに通信する。ネットワークNWは、例えば、WAN(Wide Area Network)やLAN(Local Area Network)、インターネット、専用回線、無線基地局、プロバイダなどを含む。
【0012】
サービス提供装置1は、例えば、ウェブサーバまたはアプリサーバなどと称される。サービス提供装置1は、端末装置Tからの要求に応じて、ブラウザやアプリケーションプログラムによって再生されるコンテンツを提供する。
【0013】
サービス提供装置1により提供されるコンテンツには、例えば、ブラウザによって参照されるウェブページの他、アプリケーションプログラムによって参照されるアプリページが含まれる。このようなウェブページまたはアプリページには、コメント投稿機能が実装された任意のページが含まれる。例えば、ウェブページには、ニュースサイト、オークションサイト、質問サイト等のページが含まれる。その他、コンテンツには、ミニブログ等のソーシャルネットワークサービス(SNS)において投稿されたメッセージ等も含まれる。以下においては、サービス提供装置1により提供されるコンテンツが、ブラウザによって参照されるウェブページであり、このウェブページがニュースサイトのページである場合を例に挙げて説明する。
【0014】
サービス提供装置1により提供されるコンテンツは、メインのコンテンツ(第1コンテンツ)と共に、第三者により投稿されたこの第1コンテンツに対する意見、感想等を示すコメントが(第2コンテンツ)とを含むものである。サービス提供装置1は、コメントを閲覧したユーザにより報告された内容に基づいて、そのコメントが、特定の人物に対する誹謗、中傷といった一般に公開されることが適切でない内容が含まれるコメント(以下、「不適切コメント」とも言う)であるか否かを判定する。サービス提供装置1は、あるコンテンツに対して行われたコメントのうち、不適切コメントの掲載順位を下げるか、あるいは削除した上で、ユーザに提供する。
【0015】
端末装置Tは、サービス提供装置1により提供されるニュースサイトのページを閲覧するユーザによって操作される。端末装置Tは、例えば、パーソナルコンピュータ、スマートフォンなどの携帯電話やタブレット端末、PDA(Personal Digital Assistant)などのコンピュータ装置である。端末装置Tは、ブラウザやアプリケーションプログラムなどのUA(User Agent)が動作して以下の機能を実現する。端末装置Tは、ユーザの操作に基づいて、サービス提供装置1により提供されるニュースサイトのページを要求するリクエストを送信し、リクエストに応じたニュースサイトのページに関する情報をサービス提供装置1から受信して表示する。
【0016】
[サービス提供装置の構成]
サービス提供装置1は、例えば、通信部10(受付部)と、コンテンツ取得部12と、順位決定部14と、ページ生成部16と、報告情報処理部18(受付部)、第1判定部20と、ラベル付与部22と、学習部24と、第2判定部25と、コンテンツ情報記憶部26と、報告情報記憶部28と、ユーザ情報記憶部30と、モデル記憶部32とを備える。サービス提供装置1に含まれる各機能部は、複数の装置に分散されてもよい。例えば、第1判定部20、ラベル付与部22、および学習部24と、他の機能部とは別体の装置によって実現されてもよい。また、例えば、第1判定部20と、学習部24とは別体の装置によって実現されてもよい。
【0017】
通信部10は、ネットワークNWを介して、端末装置T等と通信する。通信部10は、例えば、NIC等の通信インターフェースを含む。
【0018】
コンテンツ取得部12は、ユーザにより要求されたニュースページの記事情報26A(第1コンテンツ)と、この記事情報26Aに対して投稿された1以上のコメントを含むコメント情報26B(第2コンテンツ)とを、コンテンツ情報記憶部26から取得する。
【0019】
順位決定部14は、コンテンツ取得部12により取得された1以上のコメントの掲載順位を決定する。順位決定部14は、例えば、コメントのクリック率や、コメントに対する評価、コメントに含まれる表現等に基づいて、コメントの掲載順位を決定する。例えば、順位決定部14は、コメントのクリック率が高い順に、コメントの掲載順位を決定する。順位決定部14は、不適切コメントであると判定されたコメントについては、掲載順位を下げるか、あるいは掲載対象から除外するように、コメントの掲載順位を決定する。
【0020】
ページ生成部16は、コンテンツ取得部12により取得された記事情報26Aと、コメント情報26Bに含まれる1以上のコメントとを含むニュースページを生成し、端末装置Tに送信する。このニュースページ内において、コメント情報26Bに含まれるコメントは、順位決定部14により決定された掲載順位で掲載される。
【0021】
また、ページ生成部16は、ニュースページに含まれるコメントを閲覧したユーザによる不適切コメントを報告するリクエストを、通信部10を介して受信した場合、報告内容の入力を受け付ける報告ページを生成し、端末装置Tに送信する。
【0022】
報告情報処理部18は、上記の報告ページに対してユーザにより入力された報告内容を取得し、報告情報記憶部28に記憶させる。
【0023】
第1判定部20は、報告情報記憶部28に記憶された報告情報28Aに基づいて、コメント情報26Bに含まれるコメントの各々が不適切コメントであるか否かを判定する。
【0024】
ラベル付与部22は、第1判定部20による判定結果に基づいて、コメント情報26Bに含まれるコメントの各々に対して、不適切なコメントを示すラベル(以下、「不適切ラベル」と呼ぶ)、不適切なコメントである可能性があることを示すラベル(以下、「準不適切ラベル」と呼ぶ)、および不適切なコメントではないことを示すラベル(以下、「適切ラベル」と呼ぶ)のいずれかを付与する。このラベルが付与されたコメントが、学習部24の学習に利用される学習データとなる。
【0025】
学習部24は、ラベル付与部22によってラベルが付与されたデータ(コメントと、ラベルとの組)を学習データとして機械学習を行い、コメントが不適切コメントであるか否かを判定する判定モデル32Aを生成する。学習部24は、生成した判定モデル32Aを、モデル記憶部32に記憶させる。
【0026】
第2判定部25は、学習部24により生成された判定モデル32Aを用いて、コメントが不適切コメントであるか否かを判定する。第2判定部25は、例えば、ニュースサイトのページのコメント入力欄に対してユーザにより新たなコメントが入力されると、このコメントが不適切コメントであるか否かを判定することができる。
図2は、第2判定部25によって行われる判定処理の一例を説明する図である。第2判定部25は、入力情報としてユーザにより入力されたコメント情報を受け取る。次に、第2判定部25は、モデル記憶部32に記憶された判定モデル32Aを用いて、入力されたコメント情報に含まれるコメントが不適切コメントであるか否かを判定する。次に、第2判定部25は、出力情報として不適切コメントか否かに関する情報を出力する。出力情報は、例えば確率値(不適切な確率0.8等)でもよいし、正例(適切)、負例(不適切)などを示す情報であってもよい。
【0027】
学習部24および第2判定部25は、例えば、サポートベクターマシンを用いて処理を行ってよい。また、学習部24および第2判定部25は、再帰型ニューラルネットワーク(Recurrent Neural Network:RNN)多層構造のニューラルネットワーク(Deep Neural Network:DNN)、畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)などを用いたディープラーニング技術を採用してもよい。
【0028】
コンテンツ情報記憶部26は、例えば、ニュース記事を示す記事情報26Aと、ニュース記事に対して投稿されたコメントを示すコメント情報26Bとを記憶する。記事情報26Aは、ニュース記事の配信担当者等の操作に基づいて適宜更新されるか、あるいは、日次等の所定のタイミングで実施されるバッチ処理により更新されてよい。コメント情報26Bは、ニュースページに対するユーザによるコメントの投稿処理に基づいて適宜更新されてよい。
【0029】
報告情報記憶部28は、例えば、報告ページにおいてユーザにより入力された報告内容を示す報告情報28Aを記憶する。
【0030】
ユーザ情報記憶部30は、例えば、ユーザごとの属性を示す情報を含むユーザ情報30Aを記憶する。モデル記憶部32は、学習部24により生成された判定モデル32Aを記憶する。
【0031】
サービス提供装置1の各機能部は、例えば、CPU(Central Processing Unit)等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。サービス提供装置1は、各機能部を実現するための複数のプロセッサを備えてもよい。また、これらの各機能部のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
【0032】
サービス提供装置1の各記憶部は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ、またはこれらのうち複数が組み合わされたハイブリッド型記憶装置等により実現される。サービス提供装置1の各記憶部は、単一の装置により実現されてもよい。また、サービス提供装置1の各記憶部の一部または全部は、NASや外部のストレージサーバ等、サービス提供装置1がアクセス可能な外部装置であってもよい。
【0033】
[報告情報の取得処理]
以下、サービス提供装置1の処理について説明する。まず、サービス提供装置1により実施される不適切コメントの報告情報の取得処理について説明する。
図3は、サービス提供装置1により生成され、端末装置Tに表示されるニュースページP1の一例を示す図である。ニュースページP1は、例えば、ニュース記事が表示される記事領域R1と、この記事に対して投稿された第1のコメントが表示される第1コメント領域R2と、第2のコメントが表示される第2コメント領域R3とを含む。尚、ニュースページP1は、3つ以上のコメントを表示するための領域が設定されてもよい。
【0034】
この第1コメント領域R2および第2コメント領域R3の各々には、コメントを閲覧したユーザによるコメントが不適切であることを示す報告を受け付けるボタンB1と、コメントに対するポジティブな評価の入力を受け付けるボタンB2(「良い」ボタン)と、コメントに対するネガティブな評価の入力を受け付けるボタンB3(「悪い」ボタン)とが含まれる。ボタンB2およびB3の各々には、コメントを閲覧した全ユーザがボタンを押下した合計回数があわせて表示されている。ユーザによるボタンB2またはB3の押下に基づいて、この合計回数が1つ増大される。
【0035】
ユーザが端末装置Tを操作することにより、ボタンB1が押下されると、ユーザによる報告内容の入力を受け付ける報告ページが端末装置Tに表示される。
図4は、
図3における第2コメント領域R3のボタンB1が押下された場合に端末装置Tに表示される報告ページP2の一例を示す図である。報告ページP2は、不適切コメントの種類の指定を受け付ける。不適切コメントの種類には、例えば、「性差別」、「国籍差別」、「人種差別」等が含まれる。
図4に示す例では、ユーザが不適切コメントの種類ごとに設定されたラジオボタンを選択することにより、種類の指定を受け付けるようになっている。
図4に示す例では、「誹謗・中傷」がユーザにより指定された場合を示している。
【0036】
また、報告ページP2は、コメント内における不適切な表現のユーザによる指定を受け付ける。
図4に示す例では、コメント「Bの声が嫌い。二度と出るな。」における「声が嫌い」との表現がユーザにより指定された場合を示している。また、報告ページP2は、不適切な内容の詳細として、コメントに対するユーザの意見等のフリー入力(テキスト入力)を受け付ける。
【0037】
ユーザが端末装置Tを操作することにより、上記のような報告内容を入力した後、「送信」ボタンを押下することで、サービス提供装置1に不適切コメントに関する情報を報告することが出来る。サービス提供装置1は、端末装置Tから受信した報告内容を報告情報記憶部28に記憶させる。
【0038】
図5は、報告情報記憶部28に記憶された報告情報28Aの一例を示す図である。この報告情報28Aには、ニュース記事を識別する「記事ID」と、コメントを識別する「コメントID」と、不適切コメントの報告を行ったユーザ(報告者)を識別する「ユーザID」と、上記の報告ページP2においてユーザにより指定された不適切コメントの種類を示す「種類」と、ユーザにより指定された不適切な表現を示す「不適切な表現」と、ユーザにより入力された不適切な内容の詳細を示す「不適切な内容の詳細」とが関連付けされた1以上のデータが含まれる。以上により、サービス提供装置1は、不適切コメントに関する報告情報を収集することができる。
【0039】
[不適切コメントの判定処理(第1例)]
以下、サービス提供装置1により実施される不適切コメントの判定処理の一例について説明する。
図6は、サービス提供装置1による不適切コメントの判定処理の第1例である第1判定処理の流れを示すフローチャートである。この第1判定処理は、例えば、日ごと、週ごと等の所定のタイミングで実施されるバッチ処理により実施されてよい。
【0040】
まず、サービス提供装置1は、コンテンツ情報記憶部26に記憶されたコメント情報26Bから1件のコメントを抽出し、抽出したコメントに対する報告情報を報告情報記憶部28から抽出する(S101)。
【0041】
図7は、コンテンツ情報記憶部26に記憶されたコメント情報26Bの一例を示す図である。サービス提供装置1は、例えば、コメント情報26Bから、コメントID「C2」のコメント「Bの声が嫌い。二度と出るな。」を抽出し、このコメントID「C2」を検索キーとして、
図5に示される報告情報28Aの中から報告情報を抽出する。
【0042】
次に、サービス提供装置1は、抽出したコメントに対する報告件数が、所定の閾値以上であるか否かを判定する(S103)。ある程度の件数の報告がなされたコメントは、不適切コメントである可能性が高いことが想定される。このため、サービス提供装置1は、報告件数に基づいて、コメントが不適切コメントであるか否かの一次判断を行う。例えば、抽出したコメントに対する報告件数が、閾値(例えば、10件)以上であるか否かを判定する。
【0043】
サービス提供装置1は、抽出したコメントに対する報告件数が所定の閾値以上ではないと判定した場合、このコメントが不適切コメントと断定することはできないため、このコメントに対して「適切ラベル」を付与する(S105)。
【0044】
一方、サービス提供装置1は、抽出したコメントに対する報告件数が所定の閾値以上であると判定した場合、報告内容の信頼性を判定するための以下の処理を行う。あるコメントに対する報告が特定の偏った思想、見解等を持つ一部のユーザにより行われているような場合には、この報告の信頼性が高くない場合がある。例えば、政治的なニュース記事に対するコメントに対して、このコメントとは異なる思想、見解等を持つユーザにより報告がなされている場合には、報告件数は十分であっても、世間一般の判断では必ずしも不適切コメントとは言えない場合がある。このため、サービス提供装置1は、報告を行ったユーザの属性の分布を参照し、この属性に偏りがあるか否かを判定し(S107)、この判定結果(偏り度合い)に基づいて、抽出したコメントが不適切であるか否かを判定する。
【0045】
サービス提供装置1は、ユーザの属性の分布に偏りが無いと判定した場合、コメントに対する報告内容の信頼性が高いと判定して、このコメントに対して「不適切ラベル」を付与する(S109)。一方、サービス提供装置1は、ユーザの属性の分布に偏りがあると判定した場合、コメントに対する報告内容の信頼性が低いと判定して、このコメントに対して「準不適切ラベル」を付与する(S111)。
【0046】
図8は、ユーザ情報記憶部30に記憶されたユーザ情報30Aの一例を示す図である。サービス提供装置1は、例えば、抽出したコメントに対して報告を行ったユーザのユーザIDを
図5に示される報告情報28Aから取得し、この取得したユーザIDを検索キーとして、このユーザの属性に関する情報をユーザ情報30Aから取得する。そして、サービス提供装置1は、取得したユーザの属性の分布に偏りがあるか否かを判定する。サービス提供装置1は、例えば、ユーザの属性が、「男性」、「30代」にのみ偏っているような場合にはユーザの属性の分布に偏りがあると判定し、コメントに対する報告内容の信頼性が低いと判定して、このコメントに対して「準不適切ラベル」を付与する。
【0047】
尚、サービス提供装置1は、上記のユーザの属性の分布の偏りの判定を行う場合には、例えば、ユーザの属性に基づいてユーザベクトル(特徴情報)を生成するようにしてよい。ユーザベクトルは、ユーザの属性を要素に置き替えた疎ベクトルで表されるベクトルデータであってよい。あるいは、ユーザベクトルは、ウェブ上でのユーザの行動履歴や、ユーザの属性情報などをもとに生成されてもよい。サービス提供装置1は、このユーザベクトルのベクトル間距離に基づいて、取得したユーザの属性の分布に偏りがあるか否かを判定してよい。
【0048】
尚、サービス提供装置1は、上記のようなユーザの属性の偏り度合いに基づいて、「準不適切ラベル」をさらに細かく設定してもよい。例えば、サービス提供装置1は、ユーザの属性の偏り度合いに基づいて、「準不適切ラベル」を0から1の数値で表すように設定してもよい。この数値で表された「準不適切ラベル」は、例えば、1に近いほど、不適切である可能性が高いことを示すように設定されてよい。
【0049】
尚、サービス提供装置1は、コメント情報26Bに含まれる「良い」ボタンB2が押下された回数、「悪い」ボタンB3が押下された回数の情報を用いて、上記のラベルの判定を行ってもよい。例えば、サービス提供装置1は、「悪い」ボタンB3が押下された回数が所定の閾値以上であるコメントについては、「不適切ラベル」を付与してもよい。
【0050】
サービス提供装置1は、上記の判定結果に関する情報をコメント情報26Bに記憶させてもよい。
図9は、判定結果に関する情報が追加されたコメント情報26Bの一例を示す図である。
図9に示す例では、ラベル「適切」、「不適切」、「準不適切」が各データに追加されている。
【0051】
サービス提供装置1は、以上の処理(S101からS111)を、コメント情報26Bに含まれるコメントの各々に対して繰り返し実施する。
【0052】
次に、サービス提供装置1は、ラベルが付与されたコメント(コメントと、ラベルとの組)を学習データとして機械学習を行い、判定モデル32Aを生成する(S113)。
図10は、学習データの一例を示す図である。
図10では、
図9に示すコメント情報26Bから抽出された「コメント」と「ラベル」との組を学習データとする例を示している。サービス提供装置1は、このような学習データを用いて機械学習を行うことにより生成した判定モデル32Aを、モデル記憶部32に記憶させる。サービス提供装置1の第2判定部25は、ユーザにより新たなコメントが入力されると、上記において生成されてモデル記憶部32に記憶された判定モデル32Aを用いて、入力されたコメントが不適切コメントであるか否かを判定することができる。以上により、サービス提供装置1は本フローチャートの処理を終了する。
【0053】
尚、サービス提供装置1は、不適切コメントと、不適切コメントの種類との関係を学習するようにしてもよい。また、サービス提供装置1は、コメント全文を学習データとするのではなく、ユーザにより指定された「不適切な表現」の箇所のみを学習データとするようにしてもよい。また、サービス提供装置1は、全てのコメントを学習データとするのではなく、報告内容の信頼性が高いコメントのみを学習データとするようにしてもよい。また、サービス提供装置1は、ニュース記事の本文も学習データに組み入れるようにしてもよい。
【0054】
[不適切コメントの判定処理(第2例)]
以下、サービス提供装置1により実施される不適切コメントの判定処理の他の例について説明する。
図11は、サービス提供装置1による不適切コメントの判定処理の第2例である第2判定処理の流れを示すフローチャートである。この第2判定処理は、例えば、日ごと、週ごと等の所定のタイミングで実施されるバッチ処理により実施されてよい。
【0055】
まず、サービス提供装置1は、コンテンツ情報記憶部26に記憶されたコメント情報26Bから1件のコメントを抽出し、抽出したコメントに対する報告情報を報告情報記憶部28から抽出する(S201)。
【0056】
次に、サービス提供装置1は、抽出したコメントに対する報告件数が、所定の閾値以上であるか否かを判定する(S203)。
【0057】
サービス提供装置1は、抽出したコメントに対する報告件数が所定の閾値以上ではないと判定した場合、不適切コメントと断定することはできないため、このコメントに対して「適切ラベル」を付与する(S205)。
【0058】
一方、サービス提供装置1は、抽出したコメントに対する報告件数が所定の閾値以上であると判定した場合、報告内容の信頼性を判定するための以下の処理を行う。不適切コメントはその種類に応じて、報告を行うユーザの属性の分布に傾向が表れることが想定される。例えば、「性差別(女性差別)」に関する不適切コメントに対する報告は、このコメントに対して嫌悪感を抱きやすい「女性」のユーザによりなされる傾向がある。このため、「性差別(女性差別)」に関する不適切コメントに対する報告を行ったユーザの属性の多くが「女性」である場合には、その報告の信頼性が高いことが想定される。一方、報告を行ったユーザの属性の多くが「男性」である場合には、その報告の信頼性が低いことが想定される。このため、サービス提供装置1は、不適切コメントの種類ごとに基準となる参照分布を予め定義し、実際に報告を行ったユーザの属性の分布がこの参照分布に類似しているか否かを判定し(S207)、この判定結果(類似性)に基づいて、抽出したコメントが不適切であるか否かを判定する。
【0059】
尚、サービス提供装置1は、上記のユーザの属性の分布の類似性の判定を行う場合には、例えば、ユーザの属性に基づいてユーザベクトル(特徴情報)を生成し、このユーザベクトルのベクトル間距離に基づいて、取得したユーザの属性の分布が参照分布に類似しているか否かを判定してよい。
【0060】
サービス提供装置1は、報告を行ったユーザの属性の分布が参照分布に類似していると判定した場合、コメントに対する報告内容の信頼性が高いと判定して、このコメントに対して「不適切ラベル」を付与する(S209)。一方、サービス提供装置1は、報告を行ったユーザの属性の分布がこの参照分布に類似していないと判定した場合、コメントに対する報告内容の信頼性が低いと判定して、このコメントに対して「準不適切ラベル」を付与する(S211)。
【0061】
尚、サービス提供装置1は、上記のようなユーザの属性の分布の類似性に基づいて、「準不適切ラベル」をさらに細かく設定してもよい。例えば、サービス提供装置1は、ユーザの属性の分布の類似性に基づいて、「準不適切ラベル」を0から1の数値で表すように設定してもよい。この数値で表された「準不適切ラベル」は、例えば、1に近いほど、不適切である可能性が高いことを示すように設定されてよい。
【0062】
サービス提供装置1は、以上の処理(S201からS211)を、コメント情報26Bに含まれるコメントの各々に対して繰り返し実施する。
【0063】
次に、サービス提供装置1は、ラベルが付与されたコメント(コメントと、ラベルとの組)を学習データとして機械学習を行い、判定モデル32Aを生成する(S213)。サービス提供装置1は、生成した判定モデル32Aを、モデル記憶部32に記憶させる。以上により、サービス提供装置1は本フローチャートの処理を終了する。
【0064】
[ニュースページの生成処理]
以下、サービス提供装置1により実施されるニュースページの生成処理の一例について説明する。
図12は、サービス提供装置1によるニュースページの生成処理の流れを示すフローチャートである。このニュースページの生成処理は、端末装置Tからのニュースページのリクエストを受信するたびに実施される。
【0065】
まず、サービス提供装置1は、ユーザの操作に基づいて端末装置Tにより送信されたニュースページを要求するリクエストを受信する(S301)。
【0066】
次に、サービス提供装置1は、要求されたニュースページの記事情報と、この記事情報に対して投稿されたコメント情報とを、コンテンツ情報記憶部26から取得する(S303)。
【0067】
次に、サービス提供装置1は、取得したコメントの掲載順位を仮決定する(S305)。サービス提供装置1は、例えば、コメントのクリック率や、コメントに対する評価、コメントに含まれる表現等に基づいて、コメントの掲載順位を仮決定する。例えば、サービス提供装置1は、コメントのクリック率が高い順に、コメントの掲載順位を仮決定する。
【0068】
次に、サービス提供装置1は、掲載順位が仮決定されたコメントの中から1件のコメントを抽出し、抽出したコメントに不適切ラベルあるいは準不適切ラベルが付与されているか否かを判定する(S307)。サービス提供装置1は、抽出したコメントに不適切ラベルあるいは準不適切ラベルが付与されていると判定した場合、このコメントの掲載順位を下げるか、あるいは掲載対象から除外するように、コメントの掲載順位を決定する(S309)。一方、サービス提供装置1は、抽出したコメントに不適切ラベルあるいは準不適切ラベルが付与されていないと判定した場合、すなわち、抽出したコメントが適切コメントであると判定した場合、上記の掲載順位を下げる等の処理は行わない。
【0069】
次に、サービス提供装置1は、全コメントに対する処理が完了した否かを判定する(S311)。サービス提供装置1は、全コメントに対する処理が完了していないと判定した場合、未処理のコメントを抽出し、上記の処理を繰り返す。一方、サービス提供装置1は、全コメントに対する処理が完了したと判定した場合、取得した記事情報と、コメント情報に含まれるコメントとを含むニュースページを生成し、端末装置Tに送信する(S313)。このニュースページにおいて、コメントは上記の掲載順位決定処理により決定された掲載順位で掲載される。
【0070】
図13は、サービス提供装置1により生成されたニュースページP1の一例を示す図である。ニュースページP1に含まれるコメントに関して、不適切ラベルあるいは準不適切ラベルが付与されたコメントは、掲載順位が下位に設定されているか、あるいは掲載対象から除外されている。以上により、本フローチャートの処理を終了する。
【0071】
[新たに投稿されたコメントの不適切判定処理]
以下、サービス提供装置1により実施される新たに投稿されたコメントの不適切判定処理の一例について説明する。サービス提供装置1は、例えば、ユーザによる端末装置Tの操作に基づいてニュースサイトのページのコメント入力欄に対して新たなコメントが投稿され、この新たなコメントを投稿するリクエストを受信した場合、モデル記憶部32に記憶された判定モデル32Aを用いて、この新たなコメントが不適切であるか否かを判定する。このような判定により、新たに投稿されたコメントが不適切であるか否かをリアルタイムで判定し、不適切であると判定されたコメントの掲載順位を下位に設定するか、あるいは掲載対象から除外するように制御することができる。
【0072】
例えば、サービス提供装置1は、新たなコメントが不適切ではないと判定した場合、このコメントに対して「適切ラベル」を付与する。一方、サービス提供装置1は、投稿された新たなコメントが不適切であると判定した場合、このコメントに対して「不適切ラベル」を付与する。サービス提供装置1は、ラベルを付与したコメントを、コンテンツ情報記憶部26のコメント情報26Bに記憶させる。
【0073】
尚、サービス提供装置1は、不適切であるか否かについて断定できないコメントに対しては、「準不適切ラベル」を付与してもよい。また、サービス提供装置1は、判定モデル32Aを用いた判定結果に基づいて、「準不適切ラベル」をさらに細かく設定してもよい。例えば、サービス提供装置1は、「準不適切ラベル」を0から1の数値で表すように設定してもよい。この数値で表された「準不適切ラベル」は、例えば、1に近いほど、不適切である可能性が高いことを示すように設定されてよい。
【0074】
以上説明した実施形態のサービス提供装置1によれば、不適切コメントの検知を迅速且つ高精度で行うことが可能である。また、実施形態のサービス提供装置1によれば、不適切なコメントの掲載順位を下げる、あるいは掲載対象から除外することで、不適切なコメントが閲覧される機会を自動的に低減させることが可能である。
【0075】
尚、サービス提供装置1は、コメントに基づいてコメントベクトル(特徴情報)を生成するようにしてよい。コメントベクトルは、分散表現化されたでベクトルデータであってよい。サービス提供装置1は、既知の不適切コメントのコメントベクトルと、新たなコメントのコメントベクトルとのベクトル間距離に基づいて、新たなコメントが、不適切コメントであるか否かを判定してよい。
【0076】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。