【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年 5月25日,https://kaigi.org/jsai/webprogram/2016/paper−62.html(2016年人工知能学会全国大会発表論文) 〔刊行物等〕 平成28年 6月 7日,2016年度人工知能学会全国大会
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0013】
(1)実施形態に係るコンピュータシステムは、プロセッサとメモリとを備える。実施形態において、プロセッサは、コンテンツとユーザとの適合性判定処理を実行する。プロセッサは、例えば、適合性判定処理用のコンピュータプログラムを実行する。コンピュータプログラムは、メモリに記憶される。コンテンツは、例えば、漫画、アニメ、映画、小説である。実施形態において、コンテンツは、セリフを含む。セリフは、テキスト形式であってもよいし、音声形式であってもよい。ユーザは、典型的には、外国語学習者であるが、外国語学習者以外の者であってもよい。
【0014】
実施形態において、メモリは、話者評価情報を記憶する。話者評価情報は、コンテンツに含まれるセリフの話者に関する情報である。話者は、コンテンツに登場するキャラクターであればよく、人間であってもよいし、動物、植物、ロボット、又は架空の生物であってもよい。話者評価情報は、話者がどのようなキャラクターであるかを表す。メモリは、情報を記憶し、プロセッサが読み取り可能な装置であればよく、例えば、半導体メモリ、磁気メモリ、光学メモリである。メモリは、二次記憶装置であってもよいし、プロセッサがネットワーク経由でアクセス可能なストレージ、例えばクラウドストレージであってもよい。
【0015】
適合性判定処理は、ユーザ情報を取得することを含む。ユーザ情報は、ユーザのプロフィールを示す。ユーザのプロフィールは、ユーザがどのような人物かを表す。
【0016】
実施形態において、適合性判定処理は、ユーザ情報と話者評価情報とに基づいて、ユーザとコンテンツとの第1適合性を判定する。ユーザ情報と話者評価情報を適合性判定に用いることで、ユーザとセリフの話者との適合性の観点から、ユーザとコンテンツとの適合性が判定される。
【0017】
(2)実施形態において、ユーザ情報は、ユーザの性別を示す第1性別情報を含み、話者評価情報は、前記話者の性別を示す第2性別情報を含むことができる。第1適合性の判定は、第1性別情報と第2性別情報との適合性の判定を含むことができる。この場合、ユーザと話者の性別の適合性を判定することができる。性別情報は、例えば、男女の違いを示すことができる。性別情報は、男女の違いに限られず、例えば、LGBT、又は無性別を示してもよい。性別情報の適合性の判定は、例えば、性が一致するか否かの判定を含んでも良いし、性の関連性の判定を含んでも良い。
【0018】
(3)実施形態において、ユーザ情報は、ユーザの職業を示す第1職業情報を含み、話者評価情報は、話者の職業を示す第2職業情報を含むことができる。第1適合性の判定は、第1職業情報と第2職業情報との適合性の判定を含むことができる。この場合、ユーザと話者の職業の適合性を判定することができる。職業情報は、例えば、職業の種類を示すことができる。職業情報は、労働を伴う職務を示すものに限られず、例えば、学生、主婦、又は無職を示してもよい。職業情報の適合性の判定は、例えば、職業が一致するか否かの判定を含んでもよいし、職業の関連性の判定を含んでもよい。職業の関連性は、例えば、職業の類似性に応じて構造化された職業データベースを用いて判定することができる。
【0019】
(4)実施形態において、ユーザ情報は、ユーザの年齢又は年齢層を示す第1年齢情報を含み、話者評価情報は、話者の年齢又は年齢層を示す第2年齢情報を含むことができる。第1適合性の判定は、第1年齢情報と第2年齢情報との適合性の判定を含むことができる。この場合、ユーザと話者の年齢又は年齢層の適合性を判定することができる。年齢情報の適合性の判定は、例えば、年齢又は年齢層が一致するか否かの判定を含んでも良いし、年齢又は年齢層が近いか否かの判定を含んでも良い。
【0020】
(5)実施形態において、ユーザ情報は、ユーザが置かれる状況示す第1状況情報を含み、話者評価情報は、話者が登場するシーンの状況を示す第2状況情報を含むことができる。第1適合性の判定は、第1状況情報と第2状況情報との適合性の判定を含むことができる。この場合、ユーザの状況と話者が登場するシーンの状況との適合性を判定することができる。状況情報は、例えば、時間(time)、場所(place)、場合(opportunity)などの状況を示す。
【0021】
より具体的には、第1状況情報は、例えば、ユーザの活動時間帯、ユーザが行く場所、ユーザの会話がカジュアルであるかフォーマルであるか等の場合分け、を示すことができ、第2状況情報は、話者が登場するシーンの時間帯、シーンの場所、シーンがカジュアルであるかフォーマルであるか等の場合分けを示すことができる。状況情報の適合性の判定は、例えば、状況(時間、場所、又は場合)が一致するか否かの判定を含んでもよいし、状況の関連性の判定を含んでもよい。状況の1つである時間の関連性は、例えば、時間帯の近さによって判定される。状況の一つである場所の関連性は、場所の類似性に応じて構造化された場所データベースを用いて判定することができる。状況の一つである場合の関連性は、場合の類似性に応じて構造化された場合データベースを用いて判定することができる。
【0022】
(6)実施形態において、適合性判定処理は、第1適合性に基づいて、ユーザに推薦するコンテンツを示す情報を出力することを含むことができる。第1適合性に基づいてユーザに推薦されるコンテンツは、ユーザとセリフの話者とが適合したものであり、話し言葉の学習のためにユーザに適したコンテンツである。
【0023】
(7)実施形態においてユーザ情報は、ユーザの語学レベルを示すレベル情報を含むことができる。メモリは、コンテンツの難易度を示す難易度情報を記憶することができる。適合性判定処理は、レベル情報と難易度情報とに基づいて、ユーザとコンテンツとの第2適合性を判定することができる。この場合、ユーザの語学レベルとコンテンツの難易度との適合性を判定することができる。
【0024】
(8)実施形態において、適合性判定処理は、第1適合性及び第2適合性に基づいて、ユーザに推薦するコンテンツを示す情報を出力することができる。第1適合性及び第2適合性に基づいてユーザに推薦されるコンテンツは、ユーザとセリフの話者とが適合したものであるとともに、ユーザの語学レベルとコンテンツの難易度とが適合したものであるため、話し言葉の学習のためにユーザにより適したコンテンツである。
【0025】
(9)実施形態において、メモリは、セリフがテキストで構成された第1コンテンツと、セリフが音声で構成された第2コンテンツとを対応付けた対応データを記憶することができる。第1コンテンツ及び第2コンテンツのうちの一方は、原著作物であり、他方は、原著作物の二次的著作物である。二次的著作物は、例えば、漫画又は小説を原著作物とするアニメ又は実写映画である。難易度情報は、第1コンテンツに含まれるセリフの難易度を示す情報とすることができる。
【0026】
実施形態において、適合性判定処理は、少なくとも第2適合性に基づいて選択された第1コンテンツに対応する第2コンテンツを、対応データに基づいて決定し、決定した第2コンテンツを示す情報を出力することを含むことができる。この場合、セリフが音声で構成された第2コンテンツを示す情報を出力しつつも、第2適合性の判定は、セリフがテキストで構成された第1コンテンツの難易度情報に基づいて容易に行える。
【0027】
(10)実施形態に係る方法は、プロセッサが、ユーザのプロフィールを示すユーザ情報とメモリに記憶された話者評価情報とに基づいて、前記ユーザとコンテンツとの適合性を判定することを含む。実施形態において、話者評価情報は、コンテンツに含まれるセリフの話者に関する評価情報である。
【0028】
(11)実施形態に係るコンピュータプログラムは、セリフを含むコンテンツとユーザとの適合性判定処理を、プロセッサに実行させる。実施形態に係る適合性判定処理は、ユーザのプロフィールを示すユーザ情報と、コンテンツに含まれるセリフの話者に関する話者評価情報とに基づいて、ユーザとコンテンツとの適合性を判定することを含む。コンピュータプログラムは、コンピュータが読み取り可能な記憶媒体(メモリ)に格納される。記憶媒体は、プロセッサに接続されていてもよいし、可搬式であってもよい。
【0029】
[2.コンテンツ推薦コンピュータシステム]
【0030】
以下、図面に基づいて、本発明における実施形態の一つを、より詳細に説明する。
図1は、実施形態に係るコンピュータシステム10を有するネットワークシステムを示している。
図1において、コンピュータシステム10は、インターネット等のネットワーク20上のサーバコンピュータ(以下、単に「サーバ」という)によって構成されている。サーバ10は、ユーザに対するコンテンツ推薦機能とコンテンツ販売機能とを有する。
【0031】
サーバ10は、プロセッサ120とメモリ130を有する。プロセッサ120は、適合性判定処理121を実行する。プロセッサ120は、適合性判定処理121等の処理実行のため、メモリ130に記録されたコンピュータプログラム140を実行する。コンピュータプログラム140は、プロセッサ120に適合性判定処理を実行させるためのコードを含んでいる。
【0032】
実施形態のメモリ130は、コンテンツデータベース131を有する。コンテンツデータベース131には、複数のコンテンツそれぞれの電子データが格納されている。コンテンツの電子データは、例えば、ユーザへの販売用である。販売用の電子データは、コンテンツを購入したユーザ装置へ送信される。ユーザ装置は、例えば、ユーザの端末30又はユーザが利用するクラウドストレージである。
【0033】
実施形態のメモリ130は、評価データベース132を有する。評価データベース132は、コンテンツデータベース131に含まれる複数のコンテンツそれぞれに関する評価情報を有する。評価情報は、ユーザとコンテンツとの適合性を判定するために用いられる。評価データベース132の詳細は後述する。
【0034】
実施形態のメモリ130は、対応データベース133を有する。対応データベース132は、第1コンテンツと第2コンテンツとを対応付けたものである。対応データベース132の詳細は後述する。
【0035】
サーバ10は、ユーザ端末30からネットワーク20を介してアクセス可能である。ユーザ端末30は、例えば、ユーザが有するパーソナルコンピュータ、スマートフォン、タブレットである。ユーザ端末30は、プロセッサ及びメモリを有している。ユーザ端末30のメモリには、アプリケーションプログラム31が格納されている。アプリケーションプログラムは、必要な処理をユーザ端末30のプロセッサに実行させる。ユーザ端末30のプロセッサによって実行される処理は、例えば、サーバ10との間での情報の送受信、ユーザに対する情報表示の処理、ユーザからの情報受付の処理等を含む。ユーザ端末30は、ユーザ端末30にインストールされたブラウザを介して、サーバ10にアクセスしてもよい。
【0036】
図2は、ユーザとコンテンツとの適合性を判定する適合性判定処理121の手順を示している。
図2の適合性判定処理121は、サーバ10によって、ユーザにコンテンツを推薦するために行われる。以下では、
図2の適合性判定処理121によってユーザに推薦されるコンテンツは、一例として、日本語の漫画であるものとし、ユーザは、日本語の学習者であるものとする。したがって、サーバ10は、日本語学習であるユーザに適した漫画を推薦する。
【0037】
なお、
図2において、サーバ10が実行する手順は、サーバ10用のコンピュータプログラムによって実行され、ユーザ端末30が実行する手順は、ユーザアプリケーション31によって実行されるものとする。
【0038】
まず、ユーザ端末30は、ステップS11において、ユーザからユーザ情報50の入力を受け付ける。ユーザ端末30は、受け付けたユーザ情報50をサーバ10へ送信する。ユーザ情報50は、ユーザのプロフィールを示す。ユーザ情報50によって、ユーザがどのような人物であるかが表される。なお、サーバ10へ送信されるユーザ情報50は、ユーザ端末30に予め保存されていたものであってもよい。また、サーバ10へ送信されるユーザ情報50は、ユーザ端末30ではなく、クラウドストレージに保存されたものであってもよい。
【0039】
ユーザ情報50は、ユーザID情報51を有する。ユーザID情報51は、ユーザを識別するための情報であり、例えば、ユーザの名前又はユーザ番号である。
【0040】
ユーザ情報50は、ユーザの性別を示す性別情報(第1性別情報)52を有する。ここでは、第1性別情報52は、男女の違いを示すものとする。
【0041】
ユーザ情報50は、ユーザの職業を示す職業情報(第1職業情報)53を有する。ここでは、職業情報は、小学生、中学生、高校生、大学生、会社員、公務員、無職、主婦などの職業の種類を示すものとする。
【0042】
ユーザ情報50は、ユーザの年齢又は年齢層を示す年齢情報(第1年齢情報)54を有する。ここでは、年齢情報は、年齢を示すものとする。
【0043】
ユーザ情報50は、ユーザによって選択された場所を示す場所情報(第1場所情報)55を有する。選択される場所は、例えば、日本語学習者であるユーザが、日本語を、現に使用している場所、又は将来使用することとなる場所として選択される。選択される場所は、例えば、学校、会社、レストラン、店舗、駅である。
【0044】
ユーザ情報50は、ユーザの活動時間帯を示す時間情報(第1時間情報)56を有する。ユーザの活動時間帯は、ユーザが活動し他人と会話をすることが多い主要な時間帯である。ユーザの活動時間帯は、9:00〜17:00のように時刻によって表されても良いし、朝・昼・夜のように1日を2〜5種類程度に分けた区分けによって表されても良い。
【0045】
実施形態において、場所情報55及び時間情報56は、ユーザが日本語を話す際において、ユーザが置かれる状況を示す状況情報(第1状況情報)でもある。
【0046】
ユーザ情報50は、ユーザの語学レベルを示すレベル情報57を有する。ここでは、レベル情報57は、簡単化のため、日本語レベルが高いか低いかだけを示すものとする。なお、より詳細なレベル分けをする場合には、語学レベルとして、例えば、日本語能力試験(主催:国際交流基金、日本国際教育支援協会)において認定される5段階のレベルN1,N2,N3,N4,N5を用いることができる。N1は難易度が最も高く、N5は難易度が最も低い。
【0047】
サーバ10は、ステップS12において、ネットワークを介してユーザ情報50を取得する。サーバ10は、ユーザ情報50に基づいて、ステップS13の第1適合性判定をする。第1適合性判定は、ユーザとコンテンツに登場する話者(キャラクター)との適合性の観点から、ユーザとコンテンツとの適合性を判定する。実施形態の第1適合性判定を行うことで、ユーザの日本語学習に適した話者(キャラクター)が登場する漫画の選択が可能となる。
【0048】
第1適合性判定は、ユーザ情報50と、評価データベース132に格納された各コンテンツの評価情報100と、に基づいて行われる。
図3に示すように、評価データベース132は、複数のコンテンツに対応した複数の評価情報100を有する。各評価情報100は、1つのコンテンツ(漫画)に含まれる複数のテキスト毎に分けられた複数のテキスト情報101,102,103,104を有する。ここでは、漫画に含まれるテキストは、吹き出し中のセリフとし、一つの吹き出し中のテキストを一つのテキストとして扱うが、1つのテキストとして扱われる範囲は特に限定されない。テキスト情報の対象となるテキストは、吹き出し外に記載されたテキストであってもよい。吹き出し外に記載されたテキストは、例えば、効果音の表記、又は説明文である。
【0049】
各テキスト情報101,102,103,104は、テキストID(セリフID)61を有する。テキストID61は、漫画に含まれる複数のテキスト(セリフ)の識別子である。
【0050】
各テキスト情報101,102,103,104は、テキスト出現位置情報62を有する。テキスト出現位置情報62は、漫画においてテキスト(セリフ)が出現する位置を示す情報である。テキスト出現位置情報62は、例えば、テキストが出現するページ及びコマの位置を示すコマIDであってもよい。
【0051】
各テキスト情報101,102,103,104は、テキスト(セリフ)の文字列データ63を有する。
図3において、テキストID=10であるテキスト情報101は、
図4に示す漫画のコマP1に含まれる吹き出し中のセリフを表す文字列データである。テキストID=20であるテキスト情報102は、
図4に示す漫画のコマP2に含まれる吹き出し中のセリフを表す文字列データである。テキストID=30であるテキスト情報103は、
図4に示す漫画のコマP3に含まれる吹き出し中のセリフを表す文字列データである。テキストID=40であるテキスト情報104は、
図4に示す漫画のコマP4に含まれる吹き出し中のセリフを表す文字列データである。
【0052】
各テキスト情報101,102,103,104は、テキスト(セリフ)の難易度を示す難易度情報64を有する。難易度情報64は、テキスト(セリフ)とユーザの語学レベルとの適合性の判定に用いられる。ここでは、難易度情報64は、簡単化のため、難易度が高いか低いかだけを示すものとする。ここでは、テキスト(セリフ)の難易度は、テキスト(セリフ)に含まれる単語・表現の難易度に基づいて設定される。
【0053】
例えば、テキスト情報101(
図4のコマP1に対応)のセリフ「うん全身打撲っつーの?ありゃ痛いねありゃ死ぬわ」(伊藤伸平「はるかリフレイン」より引用)は、難易度の高い単語「全身打撲」、及び難易度の高い表現「っつーの」を含んでいるため、難易度情報64は「高」に設定されている。
【0054】
テキスト情報102(
図4のコマP2に対応)のセリフ「おっと遅刻だ!近道を行こう」(伊藤伸平「はるかリフレイン」より引用)は、難易度の低い単語「遅刻」「近道」や、難易度の低い表現「〜だ」「〜(よ)う」を含んでいるため、難易度情報64は「低」に設定されている。
【0055】
テキスト情報103(
図4のコマP3に対応)のセリフ「なんでわざと相手に聞こえるようにいうのよ」(伊藤伸平「はるかリフレイン」より引用)は、難易度の高い表現「なんでわざと」「〜えるようにいうのよ」を含んでいるため、難易度情報64は「高」に設定されている。
【0056】
テキスト情報104(
図4のコマP4に対応)のセリフ「あとで電話して」(伊藤伸平「はるかリフレイン」より引用)は、難易度の低い単語「電話」や、難易度の低い表現「〜して」を含んでいるため、難易度情報64は「低」に設定されている。
【0057】
なお、より詳細な難易度分けをする場合には、難易度情報は、前述の日本語能力試験における5段階のレベルN1,N2,N3,N4,N5に対応する値を示しても良い。この場合、各テキスト(セリフ)の難易度は、例えば、各レベルN1,N2,N3,N4,N5の各試験範囲に含まれる単語、表現及び文法に基づいて評価され、評価結果が難易度情報64として設定される。
【0058】
各テキスト情報101,102,103,104は、話者評価情報65を有する。話者評価情報65は、セリフの話者に関する情報である。話者評価情報65は、ユーザとセリフの話者との適合性の判定に用いられる。ユーザと話者との適合性の判定は、ユーザ情報50に含まれる各情報52,53,54,55,56,57と、評価情報65に含まれる各情報651,652,653,654,655との対比により行われる。なお、セリフ以外のテキストに関するテキスト情報は、話者評価情報653を有していなくても良い。
【0059】
話者評価情報65は、話者の性別情報(第2性別情報)651を有する。性別情報651は、ユーザの性別と話者の性別との適合性の判定に用いられる。ここでは、第2性別情報651は、男女の違いを示すものとする。例えば、テキスト情報101,102(
図4のコマP1,P2に対応)の性別情報651は、それぞれ「男」を示す。テキスト情報103,104(
図4のコマP3,P4に対応)の性別情報651は、それぞれ「女」を示す。
【0060】
話者評価情報65は、話者の職業を示す職業情報(第2職業情報)652を有する。職業情報652は、ユーザの職業と話者の職業の適合性の判定に用いられる。ここでは、職業情報は、小学生、中学生、高校生、大学生、会社員、公務員、無職、主婦などの職業の種類を示すものとする。例えば、テキスト情報101,102,103,104(
図4のコマP1,P2,P3,P4に対応)の職業情報652は、それぞれ「高校生」を示す。
【0061】
話者評価情報65は、話者の年齢又は年齢層を示す年齢情報(第2年齢情報)653を有する。年齢情報653は、ユーザの年齢と話者の年齢又は年齢性の適合性の判定に用いられる。ここでは、年齢情報653は、年齢層を示すものとする。例えば、テキスト情報101,102,103,104(
図4のコマP1,P2,P3,P4に対応)の年齢情報653は、それぞれ「10代」を示す。
【0062】
話者評価情報65は、セリフを発した話者が登場するシーンの場所を示す場所情報(第2場所情報)654を有する。場所情報654は、ユーザによって選択された場所とシーンの場所との適合性の判定に用いられる。シーンの場所は、例えば、学校、会社、レストラン、店舗、駅である。例えば、テキスト情報101(
図4のコマP1に対応)の場所情報654は、「自宅(家)」を示す。テキスト情報102(
図4のコマP2に対応)の場所情報654は、「路上(通学路)」を示す。テキスト情報103(
図4のコマP3に対応)の場所情報654は、「自宅(家)」を示す。テキスト情報104(
図4のコマP4に対応)の場所情報654は、「学校の廊下」を示す。
【0063】
話者評価情報65は、セリフを発した話者が登場するシーンの時間帯を示す時間情報(第2時間情報)655を有する。時間情報655は、ユーザの活動時間帯とシーンの時間帯との適合性の判定に用いられる。シーンの時間帯は、9:00〜17:00のように時刻によって表されても良いし、朝・昼・夜のように1日を2〜5種類程度に分けた区分けによって表されても良い。例えば、テキスト情報101(
図4のコマP1に対応)の時間情報655は、「夜(就寝前)」を示す。テキスト情報102(
図4のコマP2に対応)の時間情報655は、「朝(登校時)」を示す。テキスト情報103(
図4のコマP3に対応)の時間情報655は、「夜(夕食後)」を示す。テキスト情報104(
図4のコマP4に対応)の時間情報654は、「夕方(下校時)」を示す。
【0064】
実施形態において、場所情報654及び時間情報655は、話者が登場するシーンの状況を示す状況情報(第2状況情報)でもある。
【0065】
図2に戻り、実施形態の第1適合性判定は、ユーザ情報50に含まれる複数の情報52,53,54,55,56と、話者評価情報653に含まれる複数の情報651,652,653,654,655と、に基づいて行われる。実施形態において、話者評価情報65は、コンテンツに含まれる複数のセリフそれぞれについて設定されているため、ユーザ情報50と話者評価情報65との適合性は、セリフ毎に判定される。
【0066】
以下、ユーザ情報50と話者評価情報65との適合性をセリフ毎に判定する例を説明する。ここでは、ユーザ情報50において、第1性別情報52は「女性」を示し、第1職業情報53は「高校生」を示し、第1年齢情報54は「16歳」を示し、第1場所情報55は「学校」を示し、第1時間情報は「日中(朝から夕方)」を示すものとする。
【0067】
ユーザ情報50と話者評価情報65との適合性の判定においては、以下1)〜5)それぞれの適合性についての判定が行われる。
1)第1性別情報52と第2性別情報651との性別適合性、
2)第1職業情報53と第2職業情報652との職業適合性、
3)第1年齢情報54と第2年齢情報653との年齢適合性、
4)第1場所情報55と第2場所情報654との場所適合性(第1状況適合性)、
5)第1時間情報56と第2時間情報655との時間適合性(第2状況適合性)
【0068】
実施形態では、各適合性判定により、適合度が算出される。適合度は、例えば、0から1までの値をとり、1が最も適合しており(高い相関)、0が全く適合していない(低い相関)ものとする。適合度は、0と1との間の値をとってもよい。
【0069】
第1性別情報52が「女性」を示す場合、テキスト情報101,102(
図4のコマP1,P2に対応)の話者は「男性」であり一致していなから、テキスト情報101,102が示すセリフそれぞれについて、性別適合性判定によって算出される性別適合度は、0であり、適合していないことを示す。一方、テキスト情報103,104(
図4のコマP3,P4に対応)の話者は「女性」であり一致しているから、テキスト情報103,104が示すセリフそれぞれについて、性別適合性判定によって算出される性別適合度は、1であり、適合していることを示す。
【0070】
第1職業情報53が「高校生」を示す場合、テキスト情報101,102,103,104(
図4のコマP1,P2,P3,P4に対応)の話者は「高校生」であり一致しているから、テキスト情報101,102,103,104が示すセリフそれぞれについて、職業適合性判定によって算出される職業適合度は、1であり、適合していることを示す。
【0071】
第1年齢情報54が「16歳」を示す場合、テキスト情報101,102,103,104(
図4のコマP1,P2,P3,P4に対応)の話者の年齢層「10代」であり一致しているから、テキスト情報101,102,103,104が示すセリフそれぞれについて、年齢適合性判定によって算出される年齢適合度は、1であり、適合していることを示す。
【0072】
第1場所情報55が「学校」を示す場合、テキスト情報101,103(
図4のコマP1、P3に対応)の話者が登場するシーンは、「自宅(家)」であり、関連性は低いため、テキスト情報101,103が示すセリフそれぞれについて、場所適合性判定によって算出される場所適合度は、例えば、比較的低い値を示す。テキスト情報102(
図4のコマP2に対応)の話者が登場するシーンは、「路上(通学路)」であり、多少の関連性は認められるため、場所適合性判定によって算出される場所適合度は、例えば、中程度の値を示す。テキスト情報102(
図4のコマP2に対応)の話者が登場するシーンは、「学校の廊下」であり一致しているから、場所適合性判定によって算出される場所適合度は、1であり、適合していることを示す。
【0073】
第1時間情報56が「日中(朝から夕方)」を示す場合、テキスト情報101,103(
図4のコマP1,P3に対応)の話者の登場する時間帯は「夜」であり、一致していないから、テキスト情報101,103が示すセリフそれぞれについて、時間適合性判定によって算出される時間適合度は、0であり、適合していないことを示す。一方、テキスト情報102,104(
図4のコマP2,P4に対応)の話者の登場する時間は、「朝」又は「夕方」であり、一致しているから、テキスト情報102,104が示すセリフそれぞれについて、場所適合性判定によって算出される場所適合度は、1であり、適合していることを示す。
【0074】
実施形態の第1適合性判定では、例えば、上記の5つの適合性判定の結果得られた5つの適合度の平均値を、ユーザと各セリフの話者との第1適合度として算出する。第1適合度は、例えば、1つのコンテンツに含まれるすべてのセリフについて算出される。なお、第1適合度を算出するための平均演算は、単純平均演算であってもよいし、重み付け平均演算であってもよい。
【0075】
例えば、性別情報の適合度に対して、高い重みを与えた場合、テキスト情報101,102(
図4のコマP1,P2に対応)の各セリフについては、ユーザと話者とで性別が異なるため、第1適合度が低くなる。一方、テキスト情報103,104(
図4のコマP3,P4に対応)の各セリフについては、ユーザと話者とで性別が同じであるため、第1適合度が高くなる(
図5参照)。
【0076】
図2に示すように、実施形態のサーバ10は、ステップS13の第1適合性判定に加えて、ユーザ情報50に基づいて、ステップS14の第2適合性判定をする。なお、第1適合性判定の実行と第2適合性判定の実行とは、いずれが先であってもよい。
【0077】
第2適合性判定は、ユーザの語学レベルと、コンテンツに含まれる言語の難易度との適合性の観点から、ユーザとコンテンツの適合性を判定する。実施形態の第2適合性判定を行うことで、ユーザの日本語レベルに適した難易度のテキスト(セリフ)が含まれている漫画の選択が可能となる。
【0078】
実施形態の第2適合性判定(難易度適合性判定)は、ユーザ情報50に含まれるレベル情報57と、評価データベース132に格納された各コンテンツの評価情報100に含まれる難易度情報64と、に基づいて行われる。実施形態において、難易度情報64は、コンテンツに含まれる複数のセリフそれぞれについて設定されているため、レベル情報57と難易度情報64との適合性は、テキスト(セリフ又はセリフ以外のテキスト)毎に判定される。
【0079】
以下、レベル情報57と難易度情報64との適合性(第2適合度)をセリフ毎に判定する例を説明する。
【0080】
ここでは、第2適合度は、例えば、0から1までの値をとり、1が最も適合しており(高い相関)、0が全く適合していない(低い相関)ものとする。適合度は、0と1との間の値をとってもよい。また、ユーザ情報50において、レベル情報57は、「低」を示しているものとする。
【0081】
レベル情報57が「低」を示す場合、テキスト情報101,103(
図4のコマP1,P3に対応)のセリフの難易度は「高」であり一致していないから、テキスト情報101,103が示すセリフそれぞれについて、難易度適合性判定によって算出される第2適合度は、0であり、低い適合度を示す(
図5参照)。一方、テキスト情報102,104(
図4のコマP2,P4に対応)のセリフの難易度は「低」であり一致しているから、テキスト情報102,104が示すセリフそれぞれについて、難易度適合性判定によって算出される第2適合度は、1であり、高い適合度を示す(
図5参照)。
【0082】
図5に示すように、第1適合度と第2適合度によって、各セリフを、ユーザと話者との適合性及び難易度の適合性の両観点から評価することができる。例えば、
図4のコマP2,P4のセリフは、いずれも難易度が低く、低い語学レベルのユーザに適合しているが、ユーザと話者との適合性の観点からは、コマP4のセリフの方が、コマP2のセリフよりも適合している。
【0083】
したがって、第1適合度と第2適合度とを総合して、ユーザとセリフとの適合度を算出すると、コマP4の適合度が最も高くなり、コマP1の適合度が最も低くなり、コマP2,P3の適合度が中間的な値となる。このように、本実施形態では、難易度の適合性に加えて、ユーザと話者との適合性の観点から評価することで、ユーザとセリフとの適合性をより詳細に評価することができる。
【0084】
サーバ10は、各セリフの第1適合度と第2適合度に基づいて、ユーザと各セリフとの適合度(セリフ適合度)を算出する。セリフ適合度は、例えば、第1適合度と第2適合度の平均値として求められる。平均は、単純平均でもよいし、重み付け平均でもよい。実施形態において、セリフ適合度は、コンテンツAに含まれる全セリフについて算出される。
【0085】
サーバ10は、コンテンツAに含まれる複数のセリフについてのセリフ適合度に基づいて、ユーザとコンテンツAとの適合度(コンテンツ適合度)を算出する。コンテンツ適合度は、例えば、セリフ適合度の平均値として算出される。実施形態のコンテンツ適合度は、第1適合度に基づいているため、ユーザと話者の第1適合度が高いほど、コンテンツ適合度も高くなる。しかも、実施形態のコンテンツ適合度は、第2適合度にも基づいているため、第1適合度及び第2適合度の両方が高いほど、コンテンツ適合度も高くなる。すなわち、ユーザと話者とが適合し、難易度もユーザに適合しているコンテンツほど、コンテンツ適合度が高くなる。
【0086】
サーバ10は、コンテンツ適合度を、評価データベース132に含まれる複数のコンテンツについて算出する。
【0087】
サーバ10は、コンテンツ適合度の高い1又は複数のコンテンツを決定し(ステップS15)、そのコンテンツを示す情報(コンテンツ情報)を出力する(ステップS16)。コンテンツ適合度の高いコンテンツは、サーバ10によりユーザに推薦される。ユーザへの推薦のため、出力されたコンテンツ情報は、ネットワークを介して、ユーザ端末30又はユーザの利用するクラウドストレージに送信される。ユーザ端末30は、送信されたコンテンツ情報を、ユーザ端末30のディスプレイに表示させる(ステップS17)。これにより、ユーザは、サーバ10により推薦されたコンテンツを把握できる。
【0088】
ユーザは、サーバ10により推薦されたコンテンツを購入することができる。サーバ10は、ユーザのコンテンツ購入操作(ステップS18)に基づき、ユーザへのコンテンツ販売のためのトランザクションを実行する。ユーザは、購入したコンテンツを、例えば、効率的な外国語の学習に利用することができる。
【0090】
図1及び
図6に示す対応データベース133を利用した変形例について説明する。変形例に関し特に説明しない点については、既述の説明が援用される。
【0091】
図6に示すように、対応データベース133は、複数の第1コンテンツ201それぞれに、第2コンテンツ202が対応付けられたものである。第1コンテンツ201は、漫画又は小説のように、セリフがテキストで構成されたコンテンツである。第2コンテンツ202は、アニメ又は映画のように、セリフが音声で構成されたコンテンツである。
【0092】
ここでは、各第2コンテンツ202は、対応する第1コンテンツ201を原著作物とする二次的著作物である。
【0093】
変形例において、評価データベース132に登録されているコンテンツは、第1コンテンツ201だけであり、第2コンテンツ202は登録されていない。第1コンテンツ201は、セリフがテキストで構成されているため、評価情報100の構築は容易である。しかし、第2コンテンツ202は、セリフが音声であり、セリフのテキスト情報を有しているとは限らない。このため、第2コンテンツ202から評価情報100の構築は容易ではない。ただし、変形例では、第2コンテンツ202の評価情報は不要であるため、第2コンテンツ202の評価情報100の構築を回避できる。
【0094】
変形例では、評価情報100は第1コンテンツ201についてのものであるため、第1適合度及び第2適合度は第1コンテンツ201についてだけ算出される。変形例において、サーバ10は、ステップS15において、コンテンツ適合度の高い1又は複数の第1コンテンツを選択する。
【0095】
変形例では、サーバ10は、選択された第1コンテンツを示すコンテンツ情報を出力する(ステップS16)だけでなく、対応データベース133を参照し、選択された第1コンテンツに対応する第2コンテンツを決定し、決定した第2コンテンツを示すコンテンツ情報を出力する。したがって、ユーザ端末30には、第1コンテンツだけでなく第2コンテンツの情報も送信される。つまり、サーバ10は、原著作物である第1コンテンツだけでなく、二次的著作物である第2コンテンツも、ユーザに推薦することができる。
【0096】
二次的著作物である第2コンテンツには、原著作物である第1コンテンツと同様のセリフが含まれていることが多く、選択された第1コンテンツに対応する第2コンテンツも、選択された第1コンテンツと同様に、ユーザに適合したものであることが期待される。しかも、第2コンテンツはセリフが音声であるため、話し言葉を、発音の仕方を含めて学習するのに適している。したがって、ユーザは、推薦された第2コンテンツを利用することで、効率的に話し言葉を学習できる。
【0098】
なお、本発明は、上記実施形態に限定されるものではなく、様々な変形が可能である。例えば、適合性判定処理12は、ユーザ端末のアプリケーション31によって実行されてもよい。