特許6152199 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許6152199生成装置、生成方法、及び生成プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】6152199

(24)【登録日】2017年6月2日

(45)【発行日】2017年6月21日

(54)【発明の名称】生成装置、生成方法、及び生成プログラム

(51)【国際特許分類】

G06F 17/30 20060101AFI20170612BHJP

G06F 17/27 20060101ALI20170612BHJP

【ＦＩ】

G06F17/30 220A

G06F17/30 170A

G06F17/27 665

【請求項の数】15

【全頁数】28

(21)【出願番号】特願2016-127570(P2016-127570)

(22)【出願日】2016年6月28日

【審査請求日】2016年12月19日

【早期審査対象出願】

(73)【特許権者】

【識別番号】500257300

【氏名又は名称】ヤフー株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】特許業務法人酒井国際特許事務所

(72)【発明者】

【氏名】村尾一真

(72)【発明者】

【氏名】小林隼人

(72)【発明者】

【氏名】村上直也

(72)【発明者】

【氏名】野口正樹

(72)【発明者】

【氏名】谷塚太一

(72)【発明者】

【氏名】石川貴大

【審査官】成瀬博之

(56)【参考文献】

【文献】特開２００５−３０１５８４（ＪＰ，Ａ）

【文献】特開２０１３−０９７７２３（ＪＰ，Ａ）

【文献】特開２００１−２８２６４０（ＪＰ，Ａ）

【文献】特開２０１２−００８９７１（ＪＰ，Ａ）

【文献】特表２０１４−５０８９９９（ＪＰ，Ａ）

【文献】特開２０１６−０８５６７２（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１３／００

１７／２７

１７／３０

(57)【特許請求の範囲】

【請求項1】

文字情報と、提供先となるユーザに関する情報であって、当該ユーザの職種に関する情報を含むユーザ関連情報とを取得する取得部と、
前記取得部により取得したユーザ関連情報に基づいて、前記取得部により取得した文字情報から、前記ユーザが専門職であるか否かに応じて、当該専門分野の専門用語が含まれる確率を変動させて要約情報を生成する生成部と、
を備えることを特徴とする生成装置。

【請求項2】

文字情報と、提供先となるユーザに関する情報であって、当該ユーザのスクロール操作の履歴に関する情報を含むユーザ関連情報とを取得する取得部と、
前記取得部により取得したユーザ関連情報に基づいて、前記取得部により取得した文字情報から、ユーザのスクロール操作の速さを示す履歴により推定されるユーザの性格に応じて、長さを変動させて要約情報を生成する生成部と、
を備えることを特徴とする生成装置。

【請求項3】

前記生成部は、
第１文字情報と、前記第１文字情報の要約情報である第２文字情報とが対応付けられた情報により学習されたモデルに基づいて、前記文字情報から要約情報を生成する
ことを特徴とする請求項１または請求項２に記載の生成装置。

【請求項4】

前記生成部は、
前記ユーザ関連情報と前記モデルとに基づいて算出されるスコアに基づいて、前記文字情報から前記要約情報を生成する
ことを特徴とする請求項３に記載の生成装置。

【請求項5】

前記生成部は、
前記ユーザ関連情報により学習された前記モデルに基づいて、前記文字情報から要約情報を生成する
ことを特徴とする請求項３または請求項４に記載の生成装置。

【請求項6】

前記取得部は、
前記ユーザが利用する端末装置に関する端末情報を前記ユーザ関連情報として取得し、
前記生成部は、
前記端末情報に基づいて、前記文字情報から前記要約情報を生成する
ことを特徴とする請求項１〜５のいずれか１項に記載の生成装置。

【請求項7】

前記取得部は、
前記ユーザの端末装置における操作履歴に関する情報を前記ユーザ関連情報として取得し、
前記生成部は、
前記操作履歴に基づいて、前記文字情報から前記要約情報を生成する
ことを特徴とする請求項１〜６のいずれか１項に記載の生成装置。

【請求項8】

前記取得部は、
前記ユーザの属性情報を前記ユーザ関連情報として取得し、
前記生成部は、
前記属性情報に基づいて、前記文字情報から前記要約情報を生成する
ことを特徴とする請求項１〜７のいずれか１項に記載の生成装置。

【請求項9】

前記取得部は、
前記ユーザのコンテキストに関する情報を前記ユーザ関連情報として取得し、
前記生成部は、
前記コンテキストに関する情報に基づいて、前記文字情報から前記要約情報を生成する
ことを特徴とする請求項１〜８のいずれか１項に記載の生成装置。

【請求項10】

前記生成部は、
生成した前記要約情報をさらに要約した多重要約情報を生成する
ことを特徴とする請求項１〜９のいずれか１項に記載の生成装置。

【請求項11】

前記取得部は、
所定のコンテンツに含まれる記事を前記文字情報として取得し、
前記生成部は、
前記記事から前記要約情報として前記記事のタイトルを生成し、前記タイトルから前記多重要約情報として短縮タイトルを生成する
ことを特徴とする請求項１０に記載の生成装置。

【請求項12】

コンピュータが実行する生成方法であって、
文字情報と、提供先となるユーザに関する情報であって、当該ユーザの職種に関する情報を含むユーザ関連情報とを取得する取得工程と、
前記取得工程により取得したユーザ関連情報に基づいて、前記取得工程により取得した文字情報から、前記ユーザが専門職であるか否かに応じて、当該専門分野の専門用語が含まれる確率を変動させて要約情報を生成する生成工程と、
を含むことを特徴とする生成方法。

【請求項13】

文字情報と、提供先となるユーザに関する情報であって、当該ユーザの職種に関する情報を含むユーザ関連情報とを取得する取得手順と、
前記取得手順により取得したユーザ関連情報に基づいて、前記取得手順により取得した文字情報から、前記ユーザが専門職であるか否かに応じて、当該専門分野の専門用語が含まれる確率を変動させて要約情報を生成する生成手順と、
をコンピュータに実行させることを特徴とする生成プログラム。

【請求項14】

コンピュータが実行する生成方法であって、
文字情報と、提供先となるユーザに関する情報であって、当該ユーザのスクロール操作の履歴に関する情報を含むユーザ関連情報とを取得する取得工程と、
前記取得工程により取得したユーザ関連情報に基づいて、前記取得工程により取得した文字情報から、ユーザのスクロール操作の速さを示す履歴により推定されるユーザの性格に応じて、長さを変動させて要約情報を生成する生成工程と、
を含むことを特徴とする生成方法。

【請求項15】

文字情報と、提供先となるユーザに関する情報であって、当該ユーザのスクロール操作の履歴に関する情報を含むユーザ関連情報とを取得する取得手順と、
前記取得手順により取得したユーザ関連情報に基づいて、前記取得手順により取得した文字情報から、ユーザのスクロール操作の速さを示す履歴により推定されるユーザの性格に応じて、長さを変動させて要約情報を生成する生成手順と、
をコンピュータに実行させることを特徴とする生成プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、生成装置、生成方法、及び生成プログラムに関する。

【背景技術】

【0002】

従来、文章の要約を自動で生成する要約生成に関する技術が提供されている。例えば、記事や見出し等からタイトルを生成する技術が提供されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０１４−０５６４９９号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、上記の従来技術では、ユーザに応じて適切な要約を生成することができるとは限らない。例えば、各ユーザが利用する端末装置のサイズやフォント等が異なる複数のユーザに同じ要約を配信した場合、各ユーザの端末装置に最適な要約になっているとは限らず、ユーザにとって適切な要約が生成されるとは限らない。

【0005】

本願は、上記に鑑みてなされたものであって、ユーザに応じて適切な要約を生成することができる生成装置、生成方法、及び生成プログラムを提供することを目的とする。

【課題を解決するための手段】

【0006】

本願に係る生成装置は、文字情報と、提供先となるユーザに関する情報であるユーザ関連情報とを取得する取得部と、前記取得部により取得したユーザ関連情報に基づいて、前記取得部により取得した文字情報から要約情報を生成する生成部と、を備えたことを特徴とする。

【発明の効果】

【0007】

実施形態の一態様によれば、ユーザに応じて適切な要約を生成することができるという効果を奏する。

【図面の簡単な説明】

【0008】

【図1】図１は、実施形態に係る生成処理の一例を示す図である。

【図2】図２は、実施形態に係る生成装置の構成例を示す図である。

【図3】図３は、実施形態に係る編集情報記憶部の一例を示す図である。

【図4】図４は、実施形態に係るモデル情報記憶部の一例を示す図である。

【図5】図５は、実施形態に係るユーザ関連情報記憶部の一例を示す図である。

【図6】図６は、実施形態に係るコンテンツ情報記憶部の一例を示す図である。

【図7】図７は、実施形態に係るモデルの学習の一例を示すフローチャートである。

【図8】図８は、実施形態に係る短縮タイトルの生成の一例を示すフローチャートである。

【図9】図９は、実施形態に係る短縮タイトルの生成の一例を示す図である。

【図10】図１０は、実施形態に係るユーザ関連情報を用いたモデルの生成の一例を示す図である。

【図11】図１１は、実施形態に係る２段階の要約の生成の一例を示す図である。

【図12】図１２は、実施形態に係る端末装置に応じた短縮タイトルの生成の一例を示す図である。

【図13】図１３は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

【発明を実施するための形態】

【0009】

以下に、本願に係る生成装置、生成方法、及び生成プログラムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る生成装置、生成方法、及び生成プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

【0010】

（実施形態）
〔１．生成処理〕
まず、図１を用いて、実施形態に係る生成処理の一例について説明する。図１は、実施形態に係る生成処理の一例を示す図である。なお、本実施形態における生成処理には、生成した短縮タイトルを含むコンテンツを配信する処理を含む。図１に示す生成装置１００は、端末装置１０からの配信要求に基づいて短縮タイトルを含むコンテンツを配信する配信サービスを提供する。

【0011】

図１に示すように、生成システム１には、端末装置１０と、生成装置１００とが含まれる。端末装置１０と、生成装置１００とは図示しない所定の通信網を介して、有線または無線により通信可能に接続される。また、図１に示した生成システム１には、複数台の端末装置１０や、複数台の生成装置１００が含まれてもよい。

【0012】

端末装置１０は、ユーザによって利用される情報処理装置である。端末装置１０は、例えば、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal Digital Assistant）等により実現される。図１に示す例においては、端末装置１０がタッチパネル機能を有するスマートフォンである場合を示す。なお、以下では、端末装置１０をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置１０と読み替えることもできる。

【0013】

また、端末装置１０は、生成装置１００へコンテンツの配信を要求する。また、端末装置１０は、生成装置１００から配信されたコンテンツを所定のアプリにより表示する。なお、所定のアプリはブラウザであってもよい。

【0014】

生成装置１００は、端末装置１０に短縮タイトルを含むコンテンツを配信するサービスを提供する情報処理装置である。また、生成装置１００は、ユーザ関連情報に基づいて、文字情報から要約情報を生成する。例えば、生成装置１００は、ユーザ関連情報に基づいて、所定のコンテンツのタイトルをさらに短縮した短縮タイトルを生成する。

【0015】

なお、生成システム１には、提供元装置（図示省略）や編集者端末（図示省略）が含まれてもよい。例えば、提供元装置は、コンテンツの提供元、いわゆるコンテンツプロバイダ等によって利用される情報処理装置である。例えば、提供元装置は、提供元により作成されたコンテンツを生成装置１００に入稿する。また、例えば、編集者端末は、所定の編集者によって利用される情報処理装置である。例えば、編集者端末は、例えば、コンテンツの本文やタイトルから短縮タイトルを作成する編集者が利用する端末装置である。

【0016】

以下、図１を用いて生成装置１００による短縮タイトルの生成及び配信について説明する。図１の例では、生成装置１００は、所定の編集者が利用する編集者端末から短縮タイトルと元となるタイトルとが対応付けられた要約一覧ＥＬ１１を取得済みであるものとする。図１に示す要約一覧ＥＬ１１は、図３に示す編集情報記憶部１２１に記憶される編集情報に対応し、各コンテンツについて、所定の編集者が作成した短縮タイトルと、そのコンテンツの元のタイトルとが対応付けられた情報である。具体的には、要約一覧ＥＬ１１は、所定のコンテンツのタイトルＡから短縮タイトルＡが作成され、所定のコンテンツのタイトルＢから短縮タイトルＢが作成され、所定のコンテンツのタイトルＣから短縮タイトルＣが作成されたことを示す。なお、図１の例では、説明を簡単にするために要約一覧ＥＬ１１には、短縮タイトルに対応付けられたコンテンツの記事自体が含まれてもよい。

【0017】

まず、生成装置１００は、要約一覧ＥＬ１１を用いた学習により、要約一覧ＥＬ１１から要約生成モデルＭ１１（以下、単に「モデルＭ１１」ともいう）を生成する（ステップＳ１１）。例えば、生成装置１００は、要約一覧ＥＬ１１に示す情報を編集情報記憶部１２１（図３参照）から取得し、要約生成モデルＭ１１を学習する。このように、図１の例では、生成装置１００は、要約一覧ＥＬ１１に含まれる所定の編集者が作成した短縮タイトルとその元となるタイトルの組み合わせを用いて、要約生成モデルＭ１１を学習する。例えば、生成装置１００は、要約一覧ＥＬ１１に含まれる所定の編集者が作成した短縮タイトルとその元となるタイトルの組み合わせを正例として、所定のタイトル等の文字情報が入力された場合に短縮タイトルを出力する要約生成モデルＭ１１を学習する。

【0018】

また、生成装置１００は、学習により生成した要約生成モデルＭ１１をモデル情報記憶部１２２（図４参照）に記憶する。例えば、生成装置１００は、要約一覧ＥＬ１１に含まれる元タイトルや短縮タイトルに基づいて、カレントニューラルネットワーク等のニューラルネットワークや係り受け解析等の種々の従来技術を適宜用いて、要約生成モデルＭ１１を学習する。なお、要約生成モデルＭ１１は、例えばコンテンツのタイトルや記事の入力に対して、所定の文字数以内の短縮タイトルを生成するためのモデルであるが、要約生成モデルＭ１１の詳細については後述する。

【0019】

そして、生成装置１００は、端末装置１０からコンテンツの配信要求を取得する（ステップＳ１２）。また、図１の例では、生成装置１００は、ステップＳ１２において、端末装置１０から端末装置１０を利用するユーザＵ１に関するユーザ関連情報を取得する。例えば、生成装置１００は、端末装置１０からユーザＵ１の属性情報や端末装置１０に関する端末情報やユーザＵ１のコンテキスト情報等の種々の情報を取得する。図１の例では、生成装置１００は、ユーザ関連情報記憶部１２３に示すようなユーザ関連情報を取得するものとする。

【0020】

例えば、生成装置１００は、ユーザ関連情報として、ユーザＵ１が３０代男性であり、居住地が「地域Ａ」であることを示す属性情報を取得する。また、例えば、生成装置１００は、ユーザ関連情報として、ユーザＵ１が利用する端末装置１０の型番が「ＴＭ１１」であり、画面サイズが「ＳＺ１１」であり、設定されたフォントが「ＦＴ１１」であることを示す端末情報を取得する。なお、フォント「ＦＴ１１」には、フォントの種類やフォントサイズ等の種々の情報が含まれるものとする。また、例えば、生成装置１００は、ユーザ関連情報として、ユーザＵ１が利用する端末装置１０の現在位置が「ＬＣ１１」であり、加速度が「ＡＣ１１」であり、コンテキストが「ＣＮ１１」であることを示すコンテキスト情報を取得する。なお、ユーザ関連情報は、ユーザに関連する情報であればどのような情報であってもよい。例えば、ユーザ関連情報は、ユーザの脳波や心拍数や、推定された感情の情報などであってもよい。また、コンテキストは、長期休暇中や旅行中や電車内など、粒度によって複数に分けても良い。また、ここでいうユーザ関連情報は、ユーザを取り巻く環境等の種々の情報が含まれてもよく、天気、気温、湿度、イベント、株価、当日のニュースなど、種々の情報が含まれてもよい。

【0021】

ここでいうコンテキストは、ユーザＵ１や端末装置１０の状況やユーザＵ１や端末装置１０の環境（背景）を意味する。例えば、コンテキストは、ユーザＵ１によって端末装置１０が使われている状況や、端末装置１０を所持するユーザＵ１が置かれている状態に対応する情報である。すなわち、図１におけるコンテキストは、ユーザＵ１の状況、例えばユーザＵ１がいる場所の環境に対応する。具体的には、図１におけるコンテキストは、各ユーザ関連情報が取得された時点におけるユーザＵ１の状況に対応する。

【0022】

また、ユーザＵ１のコンテキストが「ＣＮ１１」であることは、ユーザＵ１が利用する端末装置１０の現在位置が「ＬＣ１１」であることを示す情報や、加速度が「ＡＣ１１」であることを示す情報や、種々の情報に基づいて推定されてもよい。

【0023】

また、図１の例では、説明を簡単にするために、生成装置１００がステップＳ１２において、各種のユーザ関連情報を取得する場合を示すが、生成装置１００は、各種のユーザ関連情報を各々所定のタイミングで取得してもよい。例えば、生成装置１００は、所定のタイミングでユーザＵ１のコンテキスト情報を取得し、取得したコンテキスト情報に基づいてユーザＵ１のコンテキストを推定してもよい。また、生成装置１００は、ユーザＵ１の属性情報をステップＳ１２よりも前に取得済みである場合、ステップＳ１２においては、ユーザＵ１の属性情報を取得しなくてもよい。この場合、生成装置１００は、端末装置１０を利用するユーザがユーザＵ１であることを識別するための情報を取得してもよい。

【0024】

以下では、ステップＳ１２における配信要求に対して、生成装置１００がコンテンツＣＴ１１〜ＣＴ１４を配信するものとして説明する。なお、ここでいうコンテンツＣＴ１１とは、コンテンツＩＤ「ＣＴ１１」により識別されるコンテンツを意味する。また、コンテンツＣＴ１２とは、コンテンツＩＤ「ＣＴ１２」により識別されるコンテンツを意味する。図１に示すコンテンツ一覧ＣＬ１１は、図６に示すコンテンツ情報記憶部１２４に記憶されるコンテンツ情報に対応する。例えば、コンテンツＣＴ１１は、タイトル「Ｘ月Ｙ日○○県でバス横転、直前のスピード、時速95km超」や画像ＩＭ１１等を含む。なお、コンテンツＣＴ１１には、記事が含まれるが図１では図示を省略する。

【0025】

生成装置１００は、コンテンツＣＴ１１〜ＣＴ１４を配信するために、コンテンツＣＴ１１〜ＣＴ１４の各々に対応する短縮タイトルＡＴ１１〜ＡＴ１４を生成する（ステップＳ１３）。例えば、生成装置１００は、コンテンツＣＴ１１〜ＣＴ１４の各々に対応するタイトルに基づいて、タイトルリストＡＬ１１に示すような短縮タイトルＡＴ１１〜ＡＴ１４を生成する。

【0026】

図１では、生成装置１００がコンテンツＣＴ１１〜ＣＴ１４を配信するために、コンテンツＣＴ１１〜ＣＴ１４の各々に対応する短縮タイトルＡＴ１１〜ＡＴ１４を生成するが、以下では、コンテンツＣＴ１１に対応する短縮タイトルＡＴ１１の生成を例に説明する。

【0027】

ここで、生成装置１００は、短縮タイトルを生成するために要約生成モデルＭ１１を用いる。例えば、生成装置１００は、要約生成モデルＭ１１を用いて各単語の各位置におけるスコアを算出する。例えば、生成装置１００は、以下の式（１）により各位置における各単語のスコアを算出する。

【0028】

Ｗ＿ｘのスコア＝Ｐ（Ｗ＿ｘ｜Ｗ＿｛１｝＾｛ｘ−１｝，ＩＮＰＵＴ）・・・（１）

【0029】

上記式（１）では、「Ｗ＿ｘ」は、任意の単語を示す。また、上記式（１）では、「Ｗ＿｛１｝＾｛ｘ−１｝」は、単語「Ｗ＿ｘ」よりも前の１〜ｘ−１番目までの単語を示す。このように、上記式（１）では、推定しようとする文字（単語「Ｗ＿ｘ」）より前に出力した単語すべてを条件とする。また、「Ｗ＿ｘ」の「ｘ」と、「Ｗ＿｛１｝＾｛ｘ−１｝」の「ｘ−１」とは、対応する単語の位置関係を示し、「Ｗ＿｛ｘ−１｝」は「Ｗ＿ｘ」の直前に位置する単語となる。すなわち、「Ｗ＿ｘ」は「Ｗ＿｛ｘ−１｝」に続く単語を意味する。

【0030】

上記式（１）の右辺中の「ＩＮＰＵＴ」は、例えばモデルＭ１１の入力となる文字列を示す。例えば、図１の例では、コンテンツＣＴ１１のタイトル等が入力となる。なお、「Ｗ＿ｘ」に対応する単語と、「Ｗ＿｛ｘ−１｝」に対応する単語とは異なる単語であってもよいし、同じ単語であってもよい。また、単語は、入力「ＩＮＰＵＴ」に含まれる単語に限らず、種々の単語であってもよい。例えば、単語「Ｗ」は、入力に含まれる単語の省略形や略語やニックネーム等であってもよい。また、ここでいう単語には、形態素、文字（ひらがな、カタカナ、漢字１文字）等も含まれてもよい。

【0031】

例えば、Ｗ＿ｘのスコアは、任意の文字列「ＩＮＰＵＴ」を入力として要約（短縮タイトル）を生成する場合において、任意の単語「Ｗ＿｛ｘ−１｝」の次に「Ｗ＿ｘ」に遷移する確率に対応するスコアとなる。例えば、Ｗ＿ｘのスコアは、事後確率に基づくスコアであってもよい。このように、上記式（１）の右辺中の「Ｐ」は、任意の文字列「ＩＮＰＵＴ」に応じて所定のスコアを返す関数である。

【0032】

例えば、１文字目に位置する任意の単語「Ｗ１」のスコアは、以下のような式（２）により算出される。

【0033】

Ｗ１のスコア＝Ｐ（Ｗ１｜＜Ｓ＞，ＩＮＰＵＴ）・・・（２）

【0034】

上記式（２）において、右辺中の「＜Ｓ＞」は、先頭を示す記号である。すなわち、上記式（２）の右辺中の「Ｐ」は、任意の文字列「ＩＮＰＵＴ」を入力として要約（短縮タイトル）を生成する場合において、任意の単語「Ｗ１」が先頭に出現する確率に対応するスコアを返す関数である。

【0035】

例えば、下記の式（３）は、任意の文字列「ＩＮＰＵＴ」を入力として要約（短縮タイトル）を生成する場合において、単語「バス」が先頭に出現する確率に対応するスコアを示す。この場合、任意の文字列「ＩＮＰＵＴ」は、コンテンツＣＴ１１のタイトル「Ｘ月Ｙ日○○県でバス横転、直前のスピード、時速95km超」であるものとする。

【0036】

Ｗ１（“バス”）のスコア＝Ｐ（バス｜＜Ｓ＞，ＩＮＰＵＴ）・・・（３）

【0037】

また、例えば、下記の式（４）は、任意の文字列「ＩＮＰＵＴ」を入力として要約（短縮タイトル）を生成する場合において、単語「横転」へ単語「バス」の次に遷移する確率に対応するスコアを示す。この場合、任意の文字列「ＩＮＰＵＴ」は、コンテンツＣＴ１１のタイトル「Ｘ月Ｙ日○○県でバス横転、直前のスピード、時速95km超」であるものとする。

【0038】

Ｗ２（“横転”）のスコア＝Ｐ（横転｜バス，ＩＮＰＵＴ）・・・（４）

【0039】

なお、上記式（４）では、説明を簡単にするために、Ｗ２のスコアの算出にＷ１のスコアを用いない場合を示すが、Ｗ１のスコアを加算したり、乗算したりしたＷ２のスコアを算出してもよい。すなわち、Ｗ２のスコアは、Ｗ１のスコアの影響を加味したスコアであってもよい。

【0040】

上述したような、例えば、任意の文字列「ＩＮＰＵＴ」中のすべての単語で展開した木構造は、各単語をノードとする木構造（図９中の「木構造ＳＴ１１」参照。以下同じ）により示される。このように、生成装置１００は、上記式（３）や（４）等の例に示すように、各単語の条件付き確率に基づくスコアを算出し、そのスコアに基づいて単語をつなげることにより、短縮タイトルを生成する。例えば、図９に示すような木構造ＳＴ１１の所定の系列（経路）に対応するノード（単語）のスコアの合計が最大の経路の単語をつなげて短縮タイトルを生成してもよい。

【0041】

また、図１の例では、端末装置１０の画面サイズ「ＳＺ１１」及びフォント「ＦＴ１１」により、短縮タイトルの文字数の上限値が決定されているものとする。例えば、短縮タイトルの文字数の上限値は、「全角１３」文字とする。例えば、フォントが「ＦＴ１１」である場合において、端末装置１０の表示領域ＡＲ１１に表示可能な文字数が全角１３文字であるものとする。

【0042】

例えば、生成装置１００は、文字数の上限値「全角１３」を満たす木構造中の経路のうち、スコアが最大の経路を短縮タイトルとする。例えば、生成装置１００は、木構造の所定の経路に対応する単語をつなげた文字列にあるノードを加えることにより、文字数が上限値を超えた場合、そのノードへの探索を行なわず、そのノードより先の経路の探索を終了してもよい。また、生成装置１００は、ビーム探索等の種々の従来技術を適宜用いて、探索範囲の増大を抑制するが詳細は後述する。

【0043】

ここで、図１に示す例では、生成装置１００は、ユーザ関連情報を加味したスコアを算出する。例えば、生成装置１００は、ステップＳ１２において取得したユーザＵ１のユーザ関連情報を加味したスコアを算出する。例えば、生成装置１００は、以下の式（５）を用いてユーザ関連情報を加味したスコアを算出する。

【0044】

Ｗ＿ｘのスコア＝Ｐ（Ｗ＿ｘ｜Ｗ＿｛１｝＾｛ｘ−１｝，ＩＮＰＵＴ）＊Ｕ（Ｗｘ｜Ｗ＿｛１｝＾｛ｘ−１｝，ＵＳＥＲ）・・・（５）

【0045】

上記式（５）の右辺中の「Ｕ」は、任意のユーザのユーザ関連情報「ＵＳＥＲ」に対して短縮タイトルを生成する場合において、任意の単語「Ｗ＿｛ｘ−１｝」の次に「Ｗ＿ｘ」へ遷移する確率に対応するスコアを返す関数となる。例えば、上記式（５）の右辺中の「Ｕ」は、事後確率に基づくスコアを返す関数であってもよい。このように、上記式（５）の右辺中の「Ｕ」は、任意のユーザのユーザ関連情報「ＵＳＥＲ」に応じて所定のスコアを返す関数である。ユーザ関連情報「ＵＳＥＲ」は、ユーザの属性情報や端末情報やコンテキスト情報が含まれる。なお、上記式（５）は、Ｗ＿ｘのスコアを算出する一例であり、生成装置１００は、加算する等、種々の方法によりＷ＿ｘのスコアを算出してもよい。例えば、生成装置１００は、下記の式（６）を用いて、Ｗ＿ｘのスコアを算出してもよい。例えば、下記の式（６）中の関数「ｆ」は、関数「Ｐ」の値や関数「Ｕ」の値を合算したりする等、関数「Ｐ」の値や関数「Ｕ」の値を用いて所定のスコアを算出する関数である。

【0046】

Ｗ＿ｘのスコア＝ｆ（Ｐ（Ｗ＿ｘ｜Ｗ＿｛１｝＾｛ｘ−１｝Ｗｘ−１，ＩＮＰＵＴ），Ｕ（Ｗｘ｜Ｗ＿｛１｝＾｛ｘ−１｝Ｗｘ−１，ＵＳＥＲ））・・・（６）

【0047】

例えば、関数「Ｕ」は、所定のユーザモデルにより実現されてもよい。例えば、各ユーザに対して所定の短縮タイトルを配信した場合において、その短縮タイトルをユーザが選択した場合に、その短縮タイトルとそのユーザのユーザ関連情報を正例として学習することにより、ユーザモデルを生成してもよい。この場合、例えば、ユーザモデルの各素性には、ユーザ属性情報や端末情報やコンテキスト情報などのユーザ関連情報に関する素性が含まれる。なお、上記は一例であり、関数「Ｕ」は、どのように生成されてもよい。例えば、関数「Ｕ」は、端末情報の画面サイズが小さい場合、文字数が小さい単語のスコアが高くなるようにスコアを算出してもよい。また、例えば、生成装置１００は、ユーザのニュース閲覧履歴におけるニュース中の単語のスコアを上げるようにしてもよい。例えば、生成装置１００は、上記式（５）のようにユーザが閲覧しているニュースの言語モデルとしてもよいし、単に関数「Ｕ」を「Ｕ（Ｗ＿ｘ｜ＵＳＥＲ）」などとし、ユーザがよく知っている（自然に感じる）単語の確率を上げるようにしてもよい。また、生成装置１００は、関数「Ｕ」を「Ｕ（）＝Ｕ１（）＊Ｕ２（）＊…」などとして、関数「Ｕ１」はある年齢のユーザ層のスコア、関数「Ｕ２」はある地域のユーザ層のスコア等のように、ユーザ関連情報の内容ごとに算出したスコアを用いて、関数「Ｕ」のスコアを算出してもよい。

【0048】

例えば、下記の式（７）は、ユーザがＵ１である場合のユーザ関連情報「Ｕ１」に対して短縮タイトルを生成する場合において、単語「バス」が先頭に出現する確率に対応するスコアを示す。この場合、任意の文字列「ＩＮＰＵＴ」は、コンテンツＣＴ１１のタイトル「Ｘ月Ｙ日○○県でバス横転、直前のスピード、時速95km超」であるものとする。

【0049】

Ｗ１（“バス”）のスコア＝Ｐ（バス｜＜Ｓ＞，ＩＮＰＵＴ）＊Ｕ（バス｜＜Ｓ＞，Ｕ１）・・・（７）

【0050】

上記式（７）により、ユーザがＵ１であり、任意の文字列「ＩＮＰＵＴ」を入力として要約（短縮タイトル）を生成する場合において、単語「バス」が先頭に出現する確率に対応するスコアを示す。例えば、図９中に示す例では、単語「バス」が先頭に出現する確率に対応するスコアは「０．６」となる。また、例えば、図９中に示す例では、単語「○○」が先頭に出現する確率に対応するスコアは「０．６２」となる。

【0051】

上述したように、図１の例では、短縮タイトルの文字数の上限値は「全角１３」文字であり、生成装置１００は、文字数の上限値「全角１３」を満たす木構造ＳＴ１１（図９参照）中の経路のうち、スコアが最大の経路を短縮タイトルとする。例えば、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する木構造ＳＴ１１（図９参照）を探索することにより、全角１３文字以内で最大のスコアとなる経路に対応する単語をつなげた文字列を短縮タイトルとして生成する。

【0052】

例えば、図１のタイトルリストＡＬ１１に示すように、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する短縮タイトルＡＴ１１を生成する。具体的には、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する「バス横転直前時速95km超」とする短縮タイトルＡＴ１１を生成する。なお、短縮タイトルＡＴ１１中の「横転」と「直前」との間のスペース（空白）は半角スペースとなる。このように、生成装置１００は、半角や全角等の種々の記号や文字等を適宜用いて短縮タイトル等の要約を生成する。また、図９に示すように、単語「バス」が先頭に出現する確率に対応するスコアは「０．６」よりも、単語「○○」が先頭に出現する確率に対応するスコアは「０．６２」の方が大きいが、「○○」が先頭となる短縮タイトルの経路のスコアよりも「バス」が先頭になる短縮タイトルＡＴ１１の経路のスコアの方が高いため、生成装置１００は、短縮タイトルＡＴ１１を生成する。

【0053】

このように、生成装置１００は、短縮タイトルＡＴ１１として、全角９文字、半角５文字を含む文字列を生成する。例えば、半角を全角の「０．５」文字分とした場合、短縮タイトルＡＴ１１の文字数は、「１１．５」となる。このように、生成装置１００は、全角１３文字以内を満たす短縮タイトルＡＴ１１を生成する。上記例では、半角２文字が全角１文字に対応し各文字の横幅が変動しないフォントである場合を例示したが、生成装置１００は、各文字に応じて横幅が変動するフォントである場合、各文字に応じて数値を変動させてもよい。

【0054】

また、図１の例では、生成装置１００は、コンテンツＣＴ１２のタイトルに対応する「東証時価総額バブル期超す」とする短縮タイトルＡＴ１２を生成する。また、生成装置１００は、コンテンツＣＴ１３のタイトルに対応する「A社サーチャージ7月も継続」とする短縮タイトルＡＴ１３を生成する。また、生成装置１００は、コンテンツＣＴ１４のタイトルに対応する「20XX年の五輪開催国決定」とする短縮タイトルＡＴ１４を生成する。

【0055】

その後、生成装置１００は、短縮タイトルを含むコンテンツを端末装置１０に配信する（ステップＳ１４）。具体的には、生成装置１００は、短縮タイトルＡＴ１１〜ＡＴ１４の各々を含むコンテンツＣＴ１１〜ＣＴ１４を端末装置１０へ配信する。

【0056】

そして、コンテンツＣＴ１１〜ＣＴ１４を受信した端末装置１０は、コンテンツＣＴ１１〜ＣＴ１４を表示する（ステップＳ１５）。図１では、端末装置１０は、所定のウェブページＷ１１にコンテンツＣＴ１１〜ＣＴ１４の各々に含まれる短縮タイトルＡＴ１１〜ＡＴ１４や画像ＩＭ１１〜ＩＭ１４を表示する。

【0057】

上述したように、生成装置１００は、要約生成モデルＭ１１やユーザ関連情報に基づいて所定の入力から短縮タイトルを生成する。上記の例では、生成装置１００は、要約生成モデルＭ１１とユーザモデルとに基づいて、コンテンツのタイトルから短縮タイトルを生成する。これにより、生成装置１００は、ユーザのユーザ属性情報やユーザが利用する端末装置１０の端末情報やユーザのコンテキスト情報等の種々のユーザ関連情報に基づいて要約を生成することにより、ユーザに応じて適切な要約を生成することができる。

【0058】

なお、生成装置１００は、上記に限らず種々の情報を適宜用いて短縮タイトルを生成してもよい。また、上記例では、１行になるように生成装置１００が短縮タイトルを生成する例を示したが、生成装置１００は、複数行に亘る短縮タイトル（要約）を生成してもよい。また、生成装置１００は、１文字の横幅スコアも加味して、短縮タイトルを生成してもよい。例えば、生成装置１００は、半角アルファベットの「m」や「w」は１文字とし、それ以外の半角アルファベットは０．５文字とする横幅スコアも加味して、短縮タイトルを生成してもよい。例えば、生成装置１００は、０．６文字となる半角アルファベットのスコアの方が０．８文字となる半角アルファベットのスコアよりも高くなるように、スコアを算出してもよい。

【0059】

また、生成装置１００は、端末装置１０を利用するユーザの操作履歴に応じて、生成する短縮タイトルを変動させてもよい。例えば、生成装置１００は、ユーザの操作履歴として配信したコンテンツ等へのユーザの操作に関する情報を用いてもよい。例えば、生成装置１００は、ユーザの操作履歴中にスクロールが速い等の情報が含まれる場合、そのユーザの性格をせっかちと推定し、通常よりも短い要約を生成してもよい。また、例えば、生成装置１００は、ユーザの操作履歴中にスクロールが遅い等の情報が含まれる場合、そのユーザの性格をのんびりと推定し、通常よりも長い要約を生成してもよい。

【0060】

また、例えば、生成装置１００は、ユーザの操作履歴として音声対話の履歴を用いてもよい。例えば、生成装置１００は、音声対話において最後まで聞くユーザには、情報量が通常よりも多くなるように、要約を生成してもよい。また、生成装置１００は、音声対話において途中で聞くのと止めるユーザには情報量が通常よりも情報量が通常よりも多くなるように、要約を生成してもよい。また、生成装置１００は、上記の処理を音声対話でユーザによって長さを変動させるために用いてもよい。例えば、生成装置１００は、上記の要約を音声対話の出力情報として用いてもよいし、音声対話要のモデルを用いて、音声対話の出力情報を生成してもよい。

【0061】

また、生成装置１００は、端末装置１０を利用するユーザの属性に応じて、生成する短縮タイトルを変動させてもよい。例えば、生成装置１００は、端末装置１０を利用するユーザの年代が６０代や７０代である場合、通常よりも短い要約を生成してもよい。また、例えば、生成装置１００は、端末装置１０を利用するユーザが１０代や２０代である場合、通常よりも長い要約を生成してもよい。

【0062】

また、生成装置１００は、上述のような要約を生成するモデルを用いて、生成処理を行ってもよい。例えば、生成装置１００は、端末装置１０を利用するユーザが専門職である場合、通常よりも専門用語を含む確率が高くなるモデルを用いて要約を生成してもよい。また、例えば、生成装置１００は、端末装置１０を利用するユーザが主婦である場合、通常よりも専門用語を含む確率が低くなるモデルを用いて要約を生成してもよい。また、例えば、生成装置１００は、端末装置１０を利用するユーザの職種が短縮タイトルを生成する対象のコンテンツの内容に関する専門職である場合、通常より生成される短縮タイトルよりも専門用語のスコアが高くなるようなモデルを用いて、短縮タイトルを生成してもよい。例えば、生成装置１００は、端末装置１０を利用するユーザの職種が主婦である場合、専門用語のスコアが低くなるようなモデルを用いて、短縮タイトルを生成してもよい。

【0063】

また、生成装置１００は、端末装置１０を利用するユーザのコンテキストに応じて、生成する短縮タイトルを変動させてもよい。例えば、生成装置１００は、端末装置１０を利用するユーザのコンテキストが走っている等の忙しい状態に対応するコンテキストである場合、通常よりも短い要約を生成してもよい。また、例えば、生成装置１００は、端末装置１０を利用するユーザのコンテキストが仕事中に対応するコンテキストである場合、通常よりも短い要約を生成してもよい。また、例えば、生成装置１００は、端末装置１０を利用するユーザのコンテキストが家にいる等の十分に時間がある状態に対応するコンテキストである場合、通常よりも長い要約を生成してもよい。また、生成装置１００は、上述のような要約を生成するモデルを用いて、生成処理を行ってもよい。

【0064】

また、生成装置１００は、上記に限らず、目的に応じて種々のモデルを学習してもよい。例えば、生成装置１００は、文書から文書、文書から最初の段落、文書から最初の文、文書からタイトル、文書から既存の短縮タイトル、最初の段落から最初の段落、最初の段落から最初の文等の対応関係に基づいてモデルを事前学習してもよい。また、生成装置１００は、一般文書を用いて事前学習してもよい。例えば、生成装置１００は、決定システム１における配信サービスの対象となるコンテンツに限らず、Ｗｅｂ上の一般文書等の種々のコンテンツ（情報）を用いて学習してもよい。例えば、生成装置１００は、一般文書から一般文書、一般文書からタイトル等の対応関係に基づいて、要約生成モデルを事前学習（プリトレーニング）してもよい。

【0065】

また、生成装置１００は、上述したユーザ関連情報に限らず、目的に応じて種々の情報を用いてもよい。例えば、生成装置１００は、ユーザ関連情報として、生成処理時の時間に関する情報や、気温に関する情報や、天気に関する情報等を用いてもよい。生成装置１００は、ユーザが利用する端末装置１０のＣＰＵ（Central Processing Unit）やメモリ使用率などの情報を用いてもよい。また、例えば、生成装置１００は、ユーザ関連情報等の各情報をクラスタリングしておき、事前に要約（短縮タイトル）を生成してコンテンツ記憶部１２４に格納し、配信要求時に要求元のユーザに対応する短縮タイトルを配信してもよい。

【0066】

〔２．生成装置の構成〕
次に、図２を用いて、実施形態に係る生成装置１００の構成について説明する。図２は、実施形態に係る生成装置１００の構成例を示す図である。図２に示すように、生成装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、生成装置１００は、生成装置１００の管理者等から各種操作を取得する入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

【0067】

通信部１１０は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。そして、通信部１１０は、ネットワークと有線または無線で接続され、端末装置１０や提供元装置や編集者端末との間で情報の送受信を行う。

【0068】

（記憶部１２０）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部１２０は、図２に示すように、編集情報記憶部１２１と、モデル情報記憶部１２２と、ユーザ関連情報記憶部１２３と、コンテンツ情報記憶部１２４とを有する。

【0069】

（編集情報記憶部１２１）
実施形態に係る編集情報記憶部１２１は、編集に関する各種情報（以下、「編集情報」ともいう）を記憶する。例えば、編集情報記憶部１２１は、所定の編集者により作成された短縮タイトルとその元となるタイトルに関する各種情報を記憶する。図３に、実施形態に係る編集情報記憶部１２１の一例を示す。図３に示す編集情報記憶部１２１は、「編集ＩＤ」、「元タイトル」、「短縮タイトル」といった項目を有する。

【0070】

「編集ＩＤ」は、元タイトルと短縮タイトルとの組み合わせを識別するための識別情報を示す。また、「元タイトル」は、所定の編集者が短縮タイトルを作成する際に元となったコンテンツのタイトルを示す。また、「短縮タイトル」は、対応する元タイトルから作成された短縮タイトルを示す。

【0071】

例えば、図３に示す例において、編集ＩＤ「ＥＤ１１」により識別される編集情報は、元タイトルが「タイトルＡ」であり、短縮タイトルが「短縮タイトルＡ」であることを示す。また、例えば、図３に示す例において、編集ＩＤ「ＥＤ１２」により識別される編集情報は、元タイトルが「タイトルＢ」であり、短縮タイトルが「短縮タイトルＢ」であることを示す。

【0072】

なお、編集情報記憶部１２１は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、編集情報記憶部１２１は、所定の編集者が短縮タイトルを作成する際に元となったコンテンツの記事に関する情報を記憶してもよい。また、編集情報記憶部１２１は、所定の編集者が作成した短縮タイトルとその元となったコンテンツに関する情報に限らず、生成装置１００が生成した短縮タイトルとその元となったコンテンツに関する情報を記憶してもよい。例えば、編集情報記憶部１２１は、正例とする短縮タイトルと負例とする短縮タイトルとを識別する情報を、各短縮タイトルに関連付けて記憶してもよい。すなわち、編集情報記憶部１２１は、配信先のユーザにより選択された短縮タイトルを正例とし、配信先のユーザにより選択されなかった短縮タイトルを負例として記憶してもよい。生成装置１００は、正例となる短縮タイトル、及び負例となる短縮タイトルを含む編集情報を用いて学習することにより、より精度よく要約（短縮タイトル）を生成するモデルを学習することができる。

【0073】

（モデル情報記憶部１２２）
実施形態に係るモデル情報記憶部１２２は、学習に関する情報を記憶する。例えば、モデル情報記憶部１２２は、生成処理により生成されたモデル情報を記憶する。図４は、実施形態に係るモデル情報記憶部の一例を示す図である。図４に示すモデル情報記憶部１２２は、モデル情報として、各モデルＭ１１等に対応させて「素性１」〜「素性３」等といった項目を有する。

【0074】

例えば、図４に示す例において、モデルＭ１１に関するモデル情報は、素性１の重みが「０．５」、素性２の重みが「−０．４」、素性３の重みが「０．２」等であることを示す。例えば、モデルの素性（特徴量）がｍ次元のベクトルで表現される場合、素性数はｍ個になり、素性１〜素性ｍの重みが記憶される。

【0075】

なお、モデル情報記憶部１２２は、上記に限らず、目的に応じて種々のモデル情報を記憶してもよい。例えば、モデル情報記憶部１２２は、所定のユーザ分類ごとに生成されたモデルを記憶してもよい。例えば、モデル情報記憶部１２２は、ユーザの性別や年代等のユーザ分類ごとに生成されたモデルを記憶してもよい。また、例えば、モデル情報記憶部１２２は、ユーザが利用する端末装置に関する分類ごとに生成されたモデルを記憶してもよい。例えば、モデル情報記憶部１２２は、端末装置の型番や画面サイズ等の分類ごとに生成されたモデルを記憶してもよい。

【0076】

（ユーザ関連情報記憶部１２３）
実施形態に係るユーザ関連情報記憶部１２３は、ユーザに関連する各種情報を記憶する。図５に、実施形態に係るユーザ関連情報記憶部１２３の一例を示す。図５に示すユーザ関連情報記憶部１２３は、「ユーザＩＤ」、「属性情報」、「端末情報」、「コンテキスト情報」といった項目が含まれる。「属性情報」には、「年齢」、「性別」、「居住地」といった項目が含まれる。「端末情報」には、「型番」、「画面サイズ」、「フォント」といった項目が含まれる。「コンテキスト情報」には、「現在位置」、「加速度」、「コンテキスト」といった項目が含まれる。

【0077】

「ユーザＩＤ」は、ユーザを識別するための識別情報を示す。例えば、ユーザＩＤ「Ｕ１」により識別されるユーザは、図１の例に示したユーザに対応する。「属性情報」は、ユーザの属性に関する各種項目を含む。「端末情報」は、ユーザが利用する端末装置１０に関する各種項目を含む。「コンテキスト情報」は、ユーザのコンテキストに関する各種項目を含む。

【0078】

また、「年齢」は、ユーザＩＤにより識別されるユーザの年齢を示す。なお、「年齢」は、例えば３５歳など、ユーザＩＤにより識別されるユーザの具体的な年齢であってもよい。また、「性別」は、ユーザＩＤにより識別されるユーザの性別を示す。また、「居住地」は、ユーザＩＤにより識別されるユーザの居住地を示す。

【0079】

また、「型番」は、ユーザＩＤにより識別されるユーザが利用する端末装置１０の型番を示す。また、「画面サイズ」は、ユーザＩＤにより識別されるユーザが利用する端末装置１０の画面サイズを示す。また、「フォント」は、ユーザＩＤにより識別されるユーザが利用する端末装置１０において設定されたフォントに関する情報を示す。

【0080】

また、「現在位置」は、ユーザＩＤにより識別されるユーザの現在位置を示す。また、「加速度」は、ユーザＩＤにより識別されるユーザの加速度を示す。また、「コンテキスト」は、ユーザＩＤにより識別されるユーザのコンテキストを示す。

【0081】

例えば、図５に示す例において、ユーザＩＤ「Ｕ１」により識別されるユーザの年齢は、「３０代」であり、性別は、「男性」であり、居住地は、「地域Ａ」であることを示す。

【0082】

なお、ユーザ関連情報記憶部１２３は、上記に限らず、目的に応じて種々の情報、例えば上記以外のデモグラフィック属性情報やサイコグラフィック属性情報等を記憶してもよい。また、生成装置１００は、端末装置１０から取得したユーザ情報に基づいて推定されるユーザに関する各種情報を、ユーザ関連情報記憶部１２３に記憶させてもよい。

【0083】

（コンテンツ情報記憶部１２４）
実施形態に係るコンテンツ情報記憶部１２４は、コンテンツ（記事）に関する各種情報を記憶する。図６に、実施形態に係るコンテンツ情報記憶部１２４の一例を示す。図６に示すコンテンツ情報記憶部１２４は、「コンテンツＩＤ」、「記事」、「タイトル」、「短縮タイトル」、「画像」といった項目を有する。

【0084】

「コンテンツＩＤ」は、コンテンツを識別するための識別情報を示す。「記事」は、コンテンツの記事を示す。「タイトル」は、コンテンツのタイトルを示す。「短縮タイトル」は、生成装置１００により生成されたコンテンツの短縮タイトルを示す。「画像」は、コンテンツの画像を示す。図６では「画像」に「ＩＭ１１」といった概念的な情報が格納される例を示したが、実際には、画像情報、または、その格納場所を示すファイルパス名などが格納される。

【0085】

例えば、図６に示す例において、コンテンツＩＤ「ＣＴ１１」により識別される記事は、「Ｘ月Ｙ日未明、○○県××市県道でＺ社のバスが横転・・・直前のスピードは時速95kmを超え・・・」といった内容であることを示す。また、コンテンツＩＤ「ＣＴ１１」により識別されるタイトルは、「Ｘ月Ｙ日○○県でバス横転、直前のスピード、時速95km超」といった内容であることを示す。また、コンテンツＩＤ「ＣＴ１１」により識別される短縮タイトル（図１中の短縮タイトルＡＴ１１）は、「バス横転直前時速95km超」といった内容であることを示す。

【0086】

なお、コンテンツ情報記憶部１２４は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、コンテンツ情報記憶部１２４は、コンテンツを取得した日時やコンテンツが作成された日時に関する情報を記憶してもよい。コンテンツ情報記憶部１２４は、各提供元に関する情報やコンテンツのカテゴリに関する情報を記憶してもよい。

【0087】

（制御部１３０）
図２の説明に戻って、制御部１３０は、コントローラ（controller）であり、例えば、ＣＰＵやＭＰＵ（Micro Processing Unit）等によって、生成装置１００内部の記憶装置に記憶されている各種プログラム（生成プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、コントローラ（controller）であり、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

【0088】

図２に示すように、制御部１３０は、取得部１３１と、学習部１３２と、算出部１３３と、生成部１３４と、配信部１３５とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図２に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

【0089】

（取得部１３１）
取得部１３１は、各種情報を取得する。例えば、取得部１３１は、外部の情報処理装置から情報を取得する。また、例えば、取得部１３１は、記憶部１２０から情報を取得する。また、取得部１３１は、端末装置１０からコンテンツの配信要求を取得する。例えば、取得部１３１は、提供元装置からコンテンツの入稿を取得する。例えば、取得部１３１は、記事やタイトルを含むコンテンツの入稿を取得する。例えば、取得部１３１は、多数の提供元装置からコンテンツの入稿を取得してもよい。例えば、取得部１３１は、提供元装置から入稿されたコンテンツをコンテンツ情報記憶部１２４に記憶する。

【0090】

また、取得部１３１は、要約とその元となる情報とを対応付けた情報を取得する。図１では、取得部１３１は、所定の編集者が利用する編集者端末から短縮タイトルと元となるタイトルとが対応付けられた要約一覧ＥＬ１１を取得する。

【0091】

また、取得部１３１は、文字情報と、提供先となるユーザに関する情報であるユーザ関連情報とを取得する。例えば、取得部１３１は、所定のコンテンツに含まれるタイトルを文字情報として取得する。例えば、取得部１３１は、所定のコンテンツに含まれる記事を文字情報として取得する。

【0092】

例えば、取得部１３１は、ユーザが利用する端末装置１０に関する端末情報をユーザ関連情報として取得する。例えば、取得部１３１は、ユーザの端末装置１０における操作履歴に関する情報をユーザ関連情報として取得する。例えば、取得部１３１は、ユーザの属性情報をユーザ関連情報として取得する。例えば、取得部１３１は、ユーザのコンテキストに関する情報をユーザ関連情報として取得する。

【0093】

また、取得部１３１は、外部の情報処理装置から各種モデルを取得してもよい。例えば、取得部１３１は、外部の情報処理装置から要約生成モデルＭ１１やユーザモデル等の種々のモデルを取得してもよい。なお、外部の情報処理装置から取得部１３１により要約生成に用いるモデルを取得する場合、生成装置１００は、学習部１３２を有しなくてもよい。

【0094】

（学習部１３２）
学習部１３２は、各素性の重みを学習する。例えば、学習部１３２は、各種情報に基づいて学習によりモデルを生成する。例えば、学習部１３２は、第１文字情報と、第１文字情報の要約情報である第２文字情報とが対応付けられた情報によりモデルを学習する。図１では、学習部１３２は、要約一覧ＥＬ１１を用いた学習により、要約一覧ＥＬ１１から要約生成モデルＭ１１を生成する。

【0095】

例えば、学習部１３２は、要約一覧ＥＬ１１に示す情報を編集情報記憶部１２１から取得し、要約生成モデルＭ１１を学習する。例えば、学習部１３２は、要約一覧ＥＬ１１に含まれる所定の編集者が作成した短縮タイトルとその元となるタイトルの組み合わせを用いて、要約生成モデルＭ１１を学習する。例えば、学習部１３２は、要約一覧ＥＬ１１に含まれる元タイトルや短縮タイトルに基づいて、リカレントニューラルネットワークや係り受け解析等の種々の従来技術を適宜用いて、要約生成モデルＭ１１を学習する。例えば、学習部１３２は、学習により生成した要約生成モデルＭ１１をモデル情報記憶部１２２に記憶する。例えば、学習部１３２は、以下のような疑似学習データを用いてモデルを学習してもよい。例えば、「Ａ駅の人身事故でＢ線が遅延」を係り受け解析して、他の要素は「Ｂ線が遅延」にかかるので、統計情報などを加味して、係り受け木から必要なさそうな部分木をカットして「人身事故で山手線が遅延」などに要約した疑似学習データを用いる。例えば、このような疑似学習データは、種々の従来手法により生成することができる。そして、学習部１３２は、疑似学習データを用いて（ニューラルネットワーク）モデルを学習（プリトレーニング）した後、要約一覧ＥＬ１１等を用いて学習することにより、精度の高いモデルを生成することができる。

【0096】

また、学習部１３２は、ユーザ関連情報に基づくモデル（ユーザモデル）を学習してもよい。例えば、学習部１３２は、上記式（５）の右辺中の関数「Ｕ」に対応するモデルを学習してもよい。例えば、学習部１３２は、各ユーザに対して所定の短縮タイトルを配信した場合において、その短縮タイトルをユーザが選択した場合に、その短縮タイトルとそのユーザのユーザ関連情報を正例として学習することにより、ユーザモデルを生成してもよい。

【0097】

例えば、学習部１３２は、ユーザが利用する端末装置１０の端末情報に基づいて学習することにより、ユーザが利用する端末装置１０に応じたユーザモデルを生成してもよい。例えば、学習部１３２は、ユーザの属性情報に基づいて学習することにより、ユーザのコンテキストに関する情報に応じたユーザモデルを生成してもよい。例えば、学習部１３２は、ユーザのコンテキストに関する情報に基づいて学習することにより、ユーザのコンテキストに関する情報に応じたユーザモデルを生成してもよい。

【0098】

（算出部１３３）
算出部１３３は、文字情報から要約を生成するために用いるスコアを算出する。例えば、算出部１３３は、要約生成モデルＭ１１を用いて各単語の各位置におけるスコアを算出する。例えば、算出部１３３は、学習部１３２により生成されたユーザモデルを用いて各単語の各位置におけるスコアを算出する。

【0099】

例えば、算出部１３３は、上記式（５）により各位置における各単語のスコアを算出する。図１に示す例では、算出部１３３は、ユーザ関連情報を加味したスコアを算出する。例えば、算出部１３３は、取得したユーザＵ１のユーザ関連情報を加味したスコアを算出する。例えば、算出部１３３は、上記式（５）を用いてユーザＵ１のユーザ関連情報を加味したスコアを算出する。

【0100】

（生成部１３４）
生成部１３４は、文字情報から要約を生成する。例えば、生成部１３４は、算出部１３３により算出されるスコアに基づいて、文字情報から要約を生成する。例えば、生成部１３４は、取得部１３１により取得したユーザ関連情報に基づいて、取得部１３１により取得した文字情報から要約情報を生成する。

【0101】

生成部１３４は、第１文字情報と、第１文字情報の要約情報である第２文字情報とが対応付けられた情報により学習されたモデルに基づいて、文字情報から要約情報を生成する。例えば、生成部１３４は、ユーザ関連情報とモデルとに基づいて算出されるスコアに基づいて、文字情報から要約情報を生成する。例えば、生成部１３４は、ユーザ関連情報により学習されたモデルに基づいて、文字情報から要約情報を生成する。例えば、生成部１３４は、端末情報に基づいて、文字情報から要約情報を生成する。例えば、生成部１３４は、操作履歴に基づいて、文字情報から要約情報を生成する。例えば、生成部１３４は、属性情報に基づいて、文字情報から要約情報を生成する。例えば、生成部１３４は、コンテキストに関する情報に基づいて、文字情報から要約情報を生成する。図１の例では、生成部１３４は、コンテンツＣＴ１１のタイトルに対応する短縮タイトルＡＴ１１を生成する。また、生成部１３４は、コンテンツＣＴ１２〜ＣＴ１４のタイトルの各々に対応する短縮タイトルＡＴ１２〜ＡＴ１４を生成する。

【0102】

生成部１３４は、生成した要約情報をさらに要約した多重要約情報を生成する。例えば、生成部１３４は、記事から要約情報として記事のタイトルを生成し、タイトルから多重要約情報として短縮タイトルを生成する。なお、これらの点ついての詳細は後述する。

【0103】

（配信部１３５）
配信部１３５は、生成部１３４により生成された短縮タイトルを配信する。配信部１３５は、短縮タイトルを含むコンテンツを端末装置１０に配信する。図１の例では、配信部１３５は、短縮タイトルＡＴ１１〜ＡＴ１４の各々を含むコンテンツＣＴ１１〜ＣＴ１４を端末装置１０へ配信する。

【0104】

〔３．モデルの学習〕
次に、図７を用いて、実施形態に係る生成システム１におけるモデルの学習について説明する。図７は、実施形態に係るモデルの学習の一例を示すフローチャートである。なお、図７に示すフローチャートにより学習されるモデルは、どのようなモデルであってもよい。

【0105】

図７に示すように、生成装置１００の取得部１３１は、学習に用いる情報を取得する（ステップＳ１０１）。例えば、取得部１３１は、所定の編集者が利用する編集者端末から短縮タイトルと元となるタイトルとが対応付けられた要約一覧ＥＬ１１を取得する。その後、生成装置１００の学習部１３２は、取得した情報に基づいて学習を行う（ステップＳ１０２）。例えば、学習部１３２は、要約一覧ＥＬ１１を用いた学習により、要約一覧ＥＬ１１から要約生成モデルＭ１１を生成する。

【0106】

〔４．短縮タイトルの生成〕
次に、図８を用いて、実施形態に係る生成システム１における要約の生成について説明する。図８は、実施形態に係る短縮タイトルの生成の一例を示すフローチャートである。

【0107】

図８に示すように、生成装置１００の取得部１３１は、コンテンツの配信要求を取得する（ステップＳ２０１）。例えば、取得部１３１は、端末装置１０からコンテンツの配信要求を取得する。また、取得部１３１は、要求元のユーザ関連情報を取得する（ステップＳ２０２）。例えば、取得部１３１は、端末装置１０からユーザ関連情報を取得する。

【0108】

その後、生成装置１００の生成部１３４は、ユーザ関連情報に基づいて短縮タイトルの文字数の上限値を決定する（ステップＳ２０３）。生成部１３４は、端末装置１０の画面サイズ「ＳＺ１１」及びフォント「ＦＴ１１」に基づいて、短縮タイトルの文字数の上限値を決定する。例えば、生成部１３４は、短縮タイトルの文字数の上限値を「全角１３」文字とする。また、取得部１３１は、短縮タイトルの生成に用いるモデルを取得する（ステップＳ２０５）。例えば、取得部１３１は、モデル情報記憶部１３２から要約生成モデルＭ１１を取得する。

【0109】

その後、生成部１３４は、モデルと文字数の上限値とに基づいて短縮タイトルを生成する（ステップＳ２０４）。例えば、生成部１３４は、コンテンツＣＴ１１のタイトルに対応する短縮タイトルＡＴ１１を生成する。図１の例では、生成部１３４は、コンテンツＣＴ１１のタイトルに対応する「バス横転直前時速95km超」とする短縮タイトルＡＴ１１を生成する。

【0110】

〔５．短縮タイトルの生成〕
次に、図９を用いて、実施形態に係る生成システム１における短縮タイトルの生成について説明する。図９は、実施形態に係る短縮タイトルの生成の一例を示す図である。例えば、生成装置１００は、ビーム探索の手法を用いる。なお、生成装置１００は、木構造を用いる種々の手法を用いてもよい。例えば、生成装置１００は、他の近似手法を用いてもよいし、ビタビ、Ａ＊などの厳密探索手法を用いてもよい。

【0111】

図９に示す例においては、入力情報ＩＰ１１に示すように入力「ＩＮＰＵＴ」は、コンテンツＣＴ１１のタイトル「Ｘ月Ｙ日○○県でバス横転、直前のスピード、時速95km超」である。また、図９に示す例においては、文字数上限ＭＸ１１に示すように上限値「ＭＡＸ」は、「１３」である。例えば、上限値「ＭＡＸ」は、「全角１３」文字とする。図９中の木構造ＳＴ１１は、「Ｗ１」の範囲に位置するノードは、先頭記号Ｓの次に遷移する単語、すなわち最初の単語に対応するノードを示す。また、「Ｗ２」の範囲に位置するノードは、「Ｗ１」の範囲に位置するノードに対応する単語から次に遷移する単語、すなわち２つめの単語に対応するノードを示す。また、「Ｗ３」の範囲に位置するノードは、「Ｗ３」の範囲に位置するノードに対応する単語から次に遷移する単語、すなわち３つめの単語に対応するノードを示す。

【0112】

図９に示す例では、生成装置１００は、ユーザ関連情報を加味したスコアを算出する。例えば、生成装置１００は、図９中の算出式ＭＦ１１に示す式により、ユーザＵ１のユーザ関連情報を加味したスコアを算出する。なお、図９中の算出式ＭＦ１１に示す式は、上記式（５）に対応する。

【0113】

例えば、生成装置１００は、図９中の算出式ＳＣ１１に示す式により、ユーザがＵ１である場合のユーザ関連情報「Ｕ１」に対して短縮タイトルを生成する場合において、単語「バス」が先頭に出現する確率に対応するスコアを算出する。なお、図９中の算出式ＳＣ１１は上記式（７）に対応する。図９の例では、生成装置１００は、算出式ＳＣ１１を用いて単語「○○」のスコアを最も高い「０．６２」と算出する。また、図９の例では、生成装置１００は、算出式ＳＣ１１を用いて単語「バス」のスコアを単語「○○」のスコアの次に高い「０．６」と算出する。また、図９の例では、生成装置１００は、算出式ＳＣ１１を用いて単語「横転」のスコアを単語「バス」のスコアの次に高い「０．５８」と算出する。また、図９の例では、生成装置１００は、算出式ＳＣ１１を用いて単語「の」のスコアを「０．０２」と算出する。

【0114】

また、生成装置１００は、木構造ＳＴ１１と、上記式（５）を用いて各単語の各々に対して算出されたスコア（確率）でソートし、ビーム幅（ｎ＝３）だけ残す（ステップＳ２０５−１）。具体的には、生成装置１００は、スコアが上位である「○○」、「バス」、及び「横転」３つの単語に対応するノードのみを残し、その先のノードを探索する。そして、生成装置１００は、合計の文字数がＭＡＸ「１３」を超えるまで探索を繰り返す（ステップＳ２０５−２）。例えば、生成装置１００は、図９中の算出式ＭＦ１２を用いて、親ノードの単語（「○○」、「バス」、及び「横転」）の次に各単語に遷移する確率に対応するスコアを算出する。これにより、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する「バス横転直前時速95km超」とする短縮タイトルＡＴ１１を生成する。

【0115】

〔６．要約生成モデルの学習に用いる情報〕
上記例においては、要約生成モデルＭ１１を生成する際に、所定の編集者が利用する編集者端末から短縮タイトルと元となるタイトルとが対応付けられた要約一覧ＥＬ１１を用いる場合を示したが、要約生成モデルの学習には種々の情報が用いられてもよい。例えば、生成装置１００は、要約生成モデルの学習にユーザ関連情報を用いてもよい。この点について、図１０を用いて説明する。図１０は、実施形態に係るユーザ関連情報を用いたモデルの生成の一例を示す図である。図１０中に示す端末装置１０は、図１のステップＳ１５により生成装置１００から配信されたコンテンツＣＴ１１〜ＣＴ１４が表示された状態を示す。

【0116】

図１０の例では、ユーザＵ１は、短縮タイトルＡＴ１１を含むコンテンツＣＴ１１を選択する（ステップＳ２１）。例えば、ユーザＵ１は、指Ｆ１により短縮タイトルＡＴ１１が表示された部分をタッチすることにより、コンテンツＣＴ１１を選択する。また、例えば、端末装置１０には、ユーザＵ１が短縮タイトルＡＴ１１を選択することにより、端末装置１０の表示が遷移し、コンテンツＣＴ１１のタイトルや記事が表示される。

【0117】

その後、端末装置１０は、生成装置１００にユーザＵ１の行動情報を送信する（ステップＳ２２）。例えば、端末装置１０は、生成装置１００にユーザＵ１の操作履歴に関する情報を送信する。図１０の例では、端末装置１０は、生成装置１００にユーザＵ１が短縮タイトルＡＴ１１を含むコンテンツＣＴ１１を選択したことを示す情報を送信する。

【0118】

ユーザＵ１の行動情報を取得した生成装置１００は、コンテンツＣＴ１１の短縮タイトルＡＴ１１とその元となるタイトルの組み合わせを正例ＲＬ１１として用いて学習を行う。例えば、生成装置１００は、正例ＲＬ１１やユーザＵ１のユーザ関連情報を用いて要約生成モデルＭ１１を更新することにより、要約生成モデルＭ１１１を生成する（ステップＳ２３）。なお、生成装置１００は、正例ＲＬ１１やユーザＵ１のユーザ関連情報を用いて新たに要約生成モデルを生成してもよい。このように、生成装置１００は、ユーザ関連情報を用いて要約生成モデルの学習を行ってもよい。

【0119】

〔７．多重要約〕
上記例においては、文字情報から要約を生成する場合を示したが、生成した要約を用いてさらに要約を生成してもよい。例えば、生成装置１００は、生成した要約をさらに要約した多重要約を生成してもよい。すなわち、生成装置１００は、１つの文字情報から多重要約を行って、所望の要約を生成してもよい。この点について、図１１を用いて説明する。図１１は、実施形態に係る２段階の要約の生成の一例を示す図である。

【0120】

図１１の例では、記事ＣＲ１１は、「Ｘ月Ｙ日未明、○○県××市県道でＺ社のバスが横転・・・直前のスピードは時速95kmを超え・・・」といった内容を含む。生成装置１００は、記事からタイトルを生成する要約生成モデルＭ３１に記事ＣＲ１１を入力することにより、記事ＣＲ１１のタイトルを生成する（ステップＳ３１）。例えば、生成装置１００は、要約生成モデルＭ３１により記事ＣＲ１１からタイトルＴＬ１１を生成する。

【0121】

図１１の例では、タイトルＴＬ１１は、「Ｘ月Ｙ日○○県でバス横転、直前のスピード、時速95km超」という内容のタイトルである。生成装置１００は、タイトルから短縮タイトルを生成する要約生成モデルＭ１１にタイトルＴＬ１１を入力することにより、タイトルＴＬ１１の短縮タイトルを生成する（ステップＳ３２）。例えば、生成装置１００は、要約生成モデルＭ１１によりタイトルＴＬ１１から短縮タイトルＡＴ１１を生成する。このように、生成装置１００は、１つの文字情報を複数回要約生成モデルにより要約することにより、所望の要約を生成することができる。なお、上記の例では、生成装置１００が複数の要約生成モデルを用いて複数回要約を生成する場合を示したが、生成装置１００は、１つの要約生成モデルを用いて複数回要約を生成してもよい。例えば、生成装置１００は、本文とそのタイトルとの組み合わせの第１データを用いて、モデルＭを学習（プリトレーニング）し、その重みを初期値として、タイトルとその短縮タイトルとの組み合わせの第２データを用いて学習（ファインチューニング）させてもよい。この場合、生成装置１００は、タイトルとその短縮タイトルとの組み合わせの第２データが少なく、本文とそのタイトルとの組み合わせの第１データが多い（例えば１０倍以上多い）場合、第２データにはない組み合わせを含むが第データ１に基づいて、学習を行うことができる。また、生成装置１００は、記事から短縮タイトルを生成する要約生成モデルを用いることにより、直接記事から短縮タイトルを生成してもよい。

【0122】

〔８．ユーザ関連情報に応じた短縮タイトルの変動〕
なお、生成装置１００が生成する要約は、配信先となるユーザのユーザ関連情報に基づいて変動する。例えば、生成装置１００はユーザが利用する端末装置１０に応じて生成する要約を変動させてもよい。この点について、図１２を用いて説明する。図１２は、実施形態に係る端末装置に応じた短縮タイトルの生成の一例を示す図である。なお、図１２の例では、各端末装置１０、１１におけるフォントの設定は同様であるものとする。

【0123】

図１２に示す例においては、生成装置１００が、各端末装置１０、１１に対してコンテンツＣＴ１１に対応する短縮タイトルＡＴ１１を生成する場合を説明する。図１２の例では、生成装置１００は、端末装置１０に対して短縮タイトルＡＴ１１を生成する（ステップＳ４１）。具体的には、生成装置１００は、表示領域ＡＲ１１に表示可能なように、コンテンツＣＴ１１のタイトルに対応する「バス横転直前時速95km超」とする短縮タイトルＡＴ１１を生成する。なお、図１２中の端末装置１０は、図１中の端末装置１０に対応しており、端末装置１０の横幅をＷＤ１１とする。

【0124】

また、図１２の例では、生成装置１００は、端末装置１１に対して短縮タイトルＡＴ４１を生成する（ステップＳ４２）。ここで、図１２の例では、端末装置１１の横幅ＷＤ４１は、端末装置１０の横幅ＷＤ１１よりも長いものとする。そのため、端末装置１１においてコンテンツＣＴ１１の短縮タイトルが表示される表示領域ＡＲ４１は、端末装置１０においてコンテンツＣＴ１１の短縮タイトルが表示される表示領域ＡＲ１１よりも横に長くなる。具体的には、端末装置１１における表示領域ＡＲ４１の横方向の長さＬ４１は、端末装置１０における表示領域ＡＲ１１の横方向の長さＬ１１よりも長くなる。つまり、表示領域ＡＲ４１には表示領域ＡＲ１１よりもより多くの文字を表示することができる。そのため、生成装置１００は、短縮タイトルＡＴ１１よりも文字数の多い短縮タイトルＡＴ４１を生成する。

【0125】

具体的には、生成装置１００は、表示領域ＡＲ４１に表示可能なように、コンテンツＣＴ１１のタイトルに対応する「○○でバス横転直前時速95km超」とする短縮タイトルＡＴ４１を生成する。この場合、生成装置１００は、端末装置１１に配信する短縮タイトルＡＴ４１には、短縮タイトルＡＴ１１に比べて「○○」という具体的な場所を示す単語を追加することができる。このように、生成装置１００は、ユーザ関連情報に応じて、適切な要約を生成することができる。なお、生成装置１００は、ユーザ関連情報記憶部１２３に記憶されたユーザ関連情報に限らず、種々のユーザ関連情報を用いて、要約を生成してもよい。例えば、生成装置１００はユーザが一時的に変更した拡大率やフォントをリアルタイムに取得して要約を動的に変化させてもよい。

【0126】

〔９．効果〕
上述してきたように、実施形態に係る生成装置１００は、取得部１３１と、生成部１３４と、を有する。取得部１３１は、文字情報と、提供先となるユーザに関する情報であるユーザ関連情報とを取得する。生成部１３４は、取得部１３１により取得したユーザ関連情報に基づいて、取得部１３１により取得した文字情報から要約情報を生成する。

【0127】

これにより、実施形態に係る生成装置１００は、提供先となるユーザのユーザ関連情報を加味して文字情報から要約を生成することにより、ユーザに応じて適切な要約を生成することができる。このように、生成装置１００は、ユーザのユーザ属性情報やユーザが利用する端末装置１０の端末情報やユーザのコンテキスト情報等の種々のユーザ関連情報に基づいて要約を生成することにより、ユーザに応じて適切な要約を生成することができる。

【0128】

また、実施形態に係る生成装置１００において、生成部１３４は、第１文字情報（実施形態においては「タイトル」。以下同じ）と、第１文字情報の要約情報である第２文字情報（実施形態においては「短縮タイトル」。以下同じ）とが対応付けられた情報により学習されたモデルに基づいて、文字情報から要約情報を生成する。

【0129】

これにより、実施形態に係る生成装置１００は、第１文字情報と、第１文字情報の要約情報である第２文字情報とが対応付けられた情報により学習されたモデルを用いて要約を生成することにより、ユーザに応じて適切な要約を生成することができる。

【0130】

また、実施形態に係る生成装置１００において、生成部１３４は、ユーザ関連情報とモデルとに基づいて算出されるスコアに基づいて、文字情報から要約情報を生成する。

【0131】

これにより、実施形態に係る生成装置１００は、ユーザ関連情報とモデルとに基づいて算出されるスコアに基づいて要約を生成することにより、ユーザに応じて適切な要約を生成することができる。

【0132】

また、実施形態に係る生成装置１００において、生成部１３４は、ユーザ関連情報により学習されたモデルに基づいて、文字情報から要約情報を生成する。

【0133】

これにより、実施形態に係る生成装置１００は、ユーザ関連情報により学習されたモデルに基づいて要約を生成することにより、ユーザに応じて適切な要約を生成することができる。

【0134】

また、実施形態に係る生成装置１００において、取得部１３１は、ユーザが利用する端末装置１０に関する端末情報をユーザ関連情報として取得する。生成部１３４は、端末情報に基づいて、文字情報から要約情報を生成する。

【0135】

これにより、実施形態に係る生成装置１００は、ユーザが利用する端末装置１０に関する端末情報を用いて要約を生成することにより、ユーザに応じて適切な要約を生成することができる。

【0136】

また、実施形態に係る生成装置１００において、取得部１３１は、ユーザの端末装置１０における操作履歴に関する情報をユーザ関連情報として取得する。生成部１３４は、操作履歴に基づいて、文字情報から要約情報を生成する。

【0137】

これにより、実施形態に係る生成装置１００は、ユーザの端末装置１０における操作履歴に関する情報を用いて要約を生成することにより、ユーザに応じて適切な要約を生成することができる。

【0138】

また、実施形態に係る生成装置１００において、取得部１３１は、ユーザの属性情報をユーザ関連情報として取得する。生成部１３４は、属性情報に基づいて、文字情報から要約情報を生成する。

【0139】

これにより、実施形態に係る生成装置１００は、ユーザの属性情報を用いて要約を生成することにより、ユーザに応じて適切な要約を生成することができる。

【0140】

また、実施形態に係る生成装置１００において、取得部１３１は、ユーザのコンテキストに関する情報をユーザ関連情報として取得する。生成部１３４は、コンテキストに関する情報に基づいて、文字情報から要約情報を生成する。

【0141】

これにより、実施形態に係る生成装置１００は、ユーザのコンテキストに関する情報を用いて要約を生成することにより、ユーザに応じて適切な要約を生成することができる。

【0142】

また、実施形態に係る生成装置１００において、生成部１３４は、生成した要約情報をさらに要約した多重要約情報を生成する。

【0143】

これにより、実施形態に係る生成装置１００は、生成した要約情報をさらに要約した多重要約情報を生成することにより、ユーザに応じて所望の要約を生成することができる。

【0144】

また、実施形態に係る生成装置１００において、取得部１３１は、所定のコンテンツに含まれる記事を文字情報として取得する。生成部１３４は、記事から要約情報として記事のタイトルを生成し、タイトルから多重要約情報として短縮タイトルを生成する。

【0145】

これにより、実施形態に係る生成装置１００は、記事から要約情報として記事のタイトルを生成し、タイトルから多重要約情報として短縮タイトルを生成することにより、ユーザに応じて適切な短縮タイトルを生成することができる。

【0146】

〔１０．ハードウェア構成〕
上述してきた実施形態に係る生成装置１００は、例えば図１３に示すような構成のコンピュータ１０００によって実現される。図１３は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ１３００、ＨＤＤ１４００、通信インターフェイス（Ｉ／Ｆ）１５００、入出力インターフェイス（Ｉ／Ｆ）１６００、及びメディアインターフェイス（Ｉ／Ｆ）１７００を有する。

【0147】

ＣＰＵ１１００は、ＲＯＭ１３００またはＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

【0148】

ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス１５００は、ネットワークＮを介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が決定したデータをネットワークＮを介して他の機器へ送信する。

【0149】

ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インターフェイス１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、決定したデータを入出力インターフェイス１６００を介して出力装置へ出力する。

【0150】

メディアインターフェイス１７００は、記録媒体１８００に格納されたプログラムまたはデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインターフェイス１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

【0151】

例えば、コンピュータ１０００が実施形態に係る生成装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部１３０の機能を実現する。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムを記録媒体１８００から読み取って実行するが、他の例として、他の装置からネットワークＮを介してこれらのプログラムを取得してもよい。

【0152】

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

【0153】

〔１１．その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

【0154】

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

【0155】

また、上述してきた実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

【0156】

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。

【符号の説明】

【0157】

１生成システム
１００生成装置
１２１編集情報記憶部
１２２モデル情報記憶部
１２３ユーザ関連情報記憶部
１２４コンテンツ情報記憶部
１３０制御部
１３１取得部
１３２学習部
１３３算出部
１３４生成部
１３５配信部

【要約】（修正有）

【課題】ユーザに応じて適切な要約を生成する。
【解決手段】生成装置１００は、取得部１３１と、生成部１３４とを有する。取得部１３１は、文字情報と、提供先となるユーザに関する情報であるユーザ関連情報とを取得する。生成部１３４は、取得部１３１により取得したユーザ関連情報に基づいて、取得部１３１により取得した文字情報から要約情報を生成する。例えば、生成部１３４は、第１文字情報と、第１文字情報の要約情報である第２文字情報とが対応付けられた情報により学習されたモデルに基づいて、文字情報から要約情報を生成する。
【選択図】図２

【図1】