特許第6069077号(P6069077)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

<>
  • 特許6069077-中継区間抽出装置、及びプログラム 図000002
  • 特許6069077-中継区間抽出装置、及びプログラム 図000003
  • 特許6069077-中継区間抽出装置、及びプログラム 図000004
  • 特許6069077-中継区間抽出装置、及びプログラム 図000005
  • 特許6069077-中継区間抽出装置、及びプログラム 図000006
  • 特許6069077-中継区間抽出装置、及びプログラム 図000007
  • 特許6069077-中継区間抽出装置、及びプログラム 図000008
  • 特許6069077-中継区間抽出装置、及びプログラム 図000009
  • 特許6069077-中継区間抽出装置、及びプログラム 図000010
  • 特許6069077-中継区間抽出装置、及びプログラム 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6069077
(24)【登録日】2017年1月6日
(45)【発行日】2017年1月25日
(54)【発明の名称】中継区間抽出装置、及びプログラム
(51)【国際特許分類】
   G06F 17/30 20060101AFI20170116BHJP
   H04N 21/845 20110101ALI20170116BHJP
【FI】
   G06F17/30 210A
   G06F17/30 220B
   G06F17/30 170D
   H04N21/845
【請求項の数】7
【全頁数】21
(21)【出願番号】特願2013-81206(P2013-81206)
(22)【出願日】2013年4月9日
(65)【公開番号】特開2014-203383(P2014-203383A)
(43)【公開日】2014年10月27日
【審査請求日】2016年2月29日
【権利譲渡・実施許諾】特許権者において、実施許諾の用意がある。
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100064908
【弁理士】
【氏名又は名称】志賀 正武
(74)【代理人】
【識別番号】100108578
【弁理士】
【氏名又は名称】高橋 詔男
(72)【発明者】
【氏名】山田 一郎
【審査官】 吉田 誠
(56)【参考文献】
【文献】 特開2009−065680(JP,A)
【文献】 特開2007−241739(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
H04N 21/845
(57)【特許請求の範囲】
【請求項1】
番組の映像データと対応付けられたテキストデータにより示される各文から場所に関する語句を抽出し、抽出した前記語句から場所を特定する場所特定部と、
前記テキストデータにより示される各文が中継に関する表現を使用したコメントであるか否かを判定する文分類部と、
前記文分類部により中継に関する表現を使用したコメントであると判定された異なる2つの文それぞれの前記コメントの種類と、前記異なる2つの文それぞれについて前記場所特定部が特定した場所が相違するか否かとに基づいて、前記異なる2つの文に対応した前記映像データの区間を中継区間として抽出する中継区間抽出部と、
を備えることを特徴とする中継区間抽出装置。
【請求項2】
前記文分類部は、前記テキストデータにより示される各文が中継の入りコメントであるか否か、中継の振りコメントであるか否か、及び、中継の締めコメントであるか否かを判定し、
前記中継区間抽出部は、中継の締めコメントであると判定された文について前記場所特定部が特定した場所と、前記テキストデータにおいて当該文より前に出現し、かつ、中継の振りコメントであると判定された他の文について前記場所特定部が特定した場所とに相違がない場合、あるいは、前記テキストデータにおいて中継の締めコメントであると判定された文より前に中継の入りコメントであると判定された文が出現する場合、中継の振りコメントまたは中継の入りコメントであると判定された前記他の文から中継の締めコメントであると判定された前記文までに対応した前記映像データの区間を現地のレポーターによる中継区間として抽出する、
ことを特徴とする請求項1に記載の中継区間抽出装置。
【請求項3】
前記文分類部は、前記テキストデータにより示される各文が中継の場所を伝えるコメントであるか否かをさらに判定し、
前記中継区間抽出部は、中継の振りコメントであると判定された文について前記場所特定部が特定した場所と、前記テキストデータにおいて当該文より後に出現し、かつ、場所を伝えるコメントであると判定された他の文について前記場所特定部が特定した場所とに相違がない場合、中継の振りコメントであると判定された前記文から場所を伝えるコメントであると判定された前記他の文までに対応した前記映像データの区間を現地のレポーターによる中継区間として抽出する、
ことを特徴とする請求項2に記載の中継区間抽出装置。
【請求項4】
前記文分類部は、前記テキストデータにより示される各文が中継の場所を伝えるコメントであるか否か、及び、中継の映像を説明するコメントであるか否かを判定し、
前記中継区間抽出部は、中継の場所を伝えるコメントであると判定された文について前記場所特定部が特定した場所と、前記テキストデータにおいて当該文より後に出現し、かつ、中継の場所を伝えるコメントあるいは中継の映像を説明するコメントであると判定された他の文について前記場所特定部が特定した場所とに相違がない場合、場所を伝えるコメントであると判定された前記文と、中継の場所を伝えるコメントあるいは中継の映像を説明するコメントであると判定された前記他の文までに対応した前記映像データの区間をレポーターが現地に不在の中継区間として抽出する、
ことを特徴とする請求項1から請求項3のいずれか1項に記載の中継区間抽出装置。
【請求項5】
前記中継区間抽出部は、中継の映像を説明するコメントであると判定された異なる2つの文のそれぞれについて前記場所特定部が特定した場所に相違がない場合、前記異なる2つの文に対応した前記映像データの区間をレポーターが現地に不在の中継区間として抽出する、
ことを特徴とする請求項4に記載の中継区間抽出装置。
【請求項6】
前記中継区間抽出部により抽出された前記中継区間に対応した前記テキストデータにおける文に空撮を表す語句が含まれている場合、前記中継区間を空撮による中継区間であると判定する空撮中継区間抽出部をさらに備える、
ことを特徴とする請求項1から請求項5のいずれか1項に記載の中継区間抽出装置。
【請求項7】
中継区間抽出装置として用いられるコンピュータを、
番組の映像データと対応付けられたテキストデータにより示される各文から場所に関する語句を抽出し、抽出した前記語句から場所を特定する場所特定部、
前記テキストデータにより示される各文が中継に関する表現を使用したコメントであるか否かを判定する文分類部、
前記文分類部により中継に関する表現を使用したコメントであると判定された異なる2つの文それぞれの前記コメントの種類と、前記異なる2つの文それぞれについて前記場所特定部が特定した場所が相違するか否かとに基づいて、前記異なる2つの文に対応した前記映像データの区間を中継区間として抽出する中継区間抽出部、
として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、中継区間抽出装置、及びプログラムに関する。
【背景技術】
【0002】
従来、サッカー中継などのシーンを分類する技術として、サッカー中継のアナウンスコメントを試合記述文と解説文の2種類に分類し、試合記述文のまとまりを一つの意味のある区間として抽出する手法や、番組中の特徴的な表現が使われる区間を抽出する手法が提案されている(例えば、非特許文献1、非特許文献2参照。)。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】山田一郎、佐野雅規、住吉英樹、柴田正啓、八木伸行、「アナウンサーと解説者のコメントを利用したサッカー番組セグメントメタデータ自動生成」、電子情報通信学会論文誌D,Vol.J89-D,No.10、2006年、p.2328−2337
【非特許文献2】山田一郎、三浦菊佳、河合吉彦、住吉英樹、八木伸行、奥村学、徳永健伸,「大域的な文章構造の類似性を利用したクローズドキャプション中の定型的な文章区間の抽出」、電子情報通信学会論文誌D,Vol.J90-D,No.9、2007年、p.2624−2633
【発明の概要】
【発明が解決しようとする課題】
【0004】
サッカー中継の場合、イベントが発生している区間のアナウンスコメントは類似した傾向を持つ。しかし、ニュース番組の場合、中継区間のコメントに使われる語彙の種類数などが多く、全てが類似している訳ではない。そのため、番組中で特徴的な表現が使われる区間を抽出する従来手法を適用しても、ニュース番組など様々なトピックを伝える番組から中継区間を抽出することは難しい。
【0005】
本発明は、このような事情を考慮してなされたもので、番組に含まれる中継区間を抽出することができる中継区間抽出装置、及びプログラムを提供する。
【課題を解決するための手段】
【0006】
[1] 本発明の一態様は、番組の映像データと対応付けられたテキストデータにより示される各文から場所に関する語句を抽出し、抽出した前記語句から場所を特定する場所特定部と、前記テキストデータにより示される各文が中継に関する表現を使用したコメントであるか否かを判定する文分類部と、前記文分類部により中継に関する表現を使用したコメントであると判定された異なる2つの文それぞれの前記コメントの種類と、前記異なる2つの文それぞれについて前記場所特定部が特定した場所が相違するか否かとに基づいて、前記異なる2つの文に対応した前記映像データの区間を中継区間として抽出する中継区間抽出部と、を備えることを特徴とする中継区間抽出装置である。
この発明によれば、中継区間抽出装置は、番組の映像データと対応付けられたテキストデータにより示される各文について場所を特定するとともに、中継に関する表現を使用したコメントであるか否かを判定する。中継区間抽出装置は、中継に関する表現を使用したコメントであると判定された2つの文それぞれのコメントの種類と、それらの文について特定された場所が相違するか否かとに基づいて、映像データの中継区間を抽出する。
これにより、中継区間抽出装置は、ニュース番組の字幕放送などを利用して、ニュース番組の映像中に含まれる中継区間のシーンを抽出することができる。
【0007】
[2] 本発明の一態様は、上述する中継区間抽出装置であって、前記文分類部は、前記テキストデータにより示される各文が中継の入りコメントであるか否か、中継の振りコメントであるか否か、及び、中継の締めコメントであるか否かを判定し、前記中継区間抽出部は、中継の締めコメントであると判定された文について前記場所特定部が特定した場所と、前記テキストデータにおいて当該文より前に出現し、かつ、中継の振りコメントであると判定された他の文について前記場所特定部が特定した場所とに相違がない場合、あるいは、前記テキストデータにおいて中継の締めコメントであると判定された文より前に中継の入りコメントであると判定された文が出現する場合、中継の振りコメントまたは中継の入りコメントであると判定された前記他の文から中継の締めコメントであると判定された前記文までに対応した前記映像データの区間を現地のレポーターによる中継区間としてする、ことを特徴とする。
この発明によれば、中継区間抽出装置は、中継の締めコメントと判定された文について特定された場所と、当該文より前に出現し、中継の振りコメントと判定された他の文について特定された場所とに相違がない場合、これらの文に対応した映像データの区間を現地のレポーターによる中継区間として抽出する。また、中継区間抽出装置は、中継の締めコメントであると判定された文より前に中継の入りコメントであると判定された文が出現する場合、これらの文に対応した映像データの区間を現地のレポーターによる中継区間として抽出する。
これにより、中継区間抽出装置は、ニュース番組の字幕放送データなどを利用して、ニュース番組中の現地のレポーターによる中継区間を抽出することができる。
【0008】
[3] 本発明の一態様は、上述する中継区間抽出装置であって、前記文分類部は、前記テキストデータにより示される各文が中継の場所を伝えるコメントであるか否かをさらに判定し、前記中継区間抽出部は、中継の振りコメントであると判定された文について前記場所特定部が特定した場所と、前記テキストデータにおいて当該文より後に出現し、かつ、場所を伝えるコメントであると判定された他の文について前記場所特定部が特定した場所とに相違がない場合、中継の振りコメントであると判定された前記文から場所を伝えるコメントであると判定された前記他の文までに対応した前記映像データの区間を現地のレポーターによる中継区間として抽出する、ことを特徴とする。
この発明によれば、中継区間抽出装置は、中継の振りコメントと判定された文について特定された場所と、当該文より後に出現し、場所を伝えるコメントと判定された他の文について特定された場所とに相違がない場合、これらの文に対応した映像データの区間を現地のレポーターによる中継区間として抽出する。
これにより、中継区間抽出装置は、ニュース番組の字幕放送データなどを利用して、中継の締めコメントがない場合にも、ニュース番組中の現地のレポーターによる中継区間を抽出することができる。
【0009】
[4] 本発明の一態様は、上述する中継区間抽出装置であって、前記文分類部は、前記テキストデータにより示される各文が中継の場所を伝えるコメントであるか否か、及び、中継の映像を説明するコメントであるか否かを判定し、前記中継区間抽出部は、中継の場所を伝えるコメントであると判定された文について前記場所特定部が特定した場所と、前記テキストデータにおいて当該文より後に出現し、かつ、中継の場所を伝えるコメントあるいは中継の映像を説明するコメントであると判定された他の文について前記場所特定部が特定した場所とに相違がない場合、場所を伝えるコメントであると判定された前記文と、中継の場所を伝えるコメントあるいは中継の映像を説明するコメントであると判定された前記他の文までに対応した前記映像データの区間をレポーターが現地に不在の中継区間として抽出する、ことを特徴とする。
この発明によれば、中継区間抽出装置は、中継の場所を伝えるコメントであると判定された文について特定された場所と、当該文より後に出現し、中継の場所を伝えるコメントあるいは中継の映像を説明するコメントと判定された他の文について特定された場所とに相違がない場合、これらの文に対応した映像データの区間をレポーターが現地に不在の中継区間として抽出する。
これにより、中継区間抽出装置は、ニュース番組の字幕放送データなどを利用して、ニュース番組中のレポーターが現地に不在の中継区間を抽出することができる。
【0010】
[5] 本発明の一態様は、上述する中継区間抽出装置であって、前記中継区間抽出部は、中継の映像を説明するコメントであると判定された異なる2つの文のそれぞれについて前記場所特定部が特定した場所に相違がない場合、前記異なる2つの文に対応した前記映像データの区間をレポーターが現地に不在の中継区間として抽出する、ことを特徴とする。
この発明によれば、中継区間抽出装置は、中継の映像を説明するコメントと判定された2つの文それぞれについて特定された場所に相違がない場合、これらの文に対応した映像データの区間をレポーターが現地に不在の中継区間として抽出する。
これにより、中継区間抽出装置は、ニュース番組の字幕放送データなどを利用して、場所を特定するコメントがない場合にも、ニュース番組中のレポーターが現地に不在の中継区間を抽出することができる。
【0011】
[6] 本発明の一態様は、上述する中継区間抽出装置であって、前記中継区間抽出部により抽出された前記中継区間に対応した前記テキストデータにおける文に空撮を表す語句が含まれている場合、前記中継区間を空撮による中継区間であると判定する空撮中継区間抽出部をさらに備える、ことを特徴とする。
この発明によれば、中継区間抽出装置は、中継区間抽出部により抽出された中継区間のテキストデータが示す文に基づいて、当該中継区間が空撮による中継区間であるかを判定する。
これにより、中継区間抽出装置は、番組中の現地レポーターによる中継区間やレポーターが現地に不在の中継区間の中から空撮による中継区間を抽出することができる。
【0012】
[7] 本発明の一態様は、中継区間抽出装置として用いられるコンピュータを、番組の映像データと対応付けられたテキストデータにより示される各文から場所に関する語句を抽出し、抽出した前記語句から場所を特定する場所特定部、前記テキストデータにより示される各文が中継に関する表現を使用したコメントであるか否かを判定する文分類部、前記文分類部により中継に関する表現を使用したコメントであると判定された異なる2つの文それぞれの前記コメントの種類と、前記異なる2つの文それぞれについて前記場所特定部が特定した場所が相違するか否かとに基づいて、前記異なる2つの文に対応した前記映像データの区間を中継区間として抽出する中継区間抽出部、として機能させるためのプログラムである。
【発明の効果】
【0013】
本発明によれば、番組に含まれる中継区間を抽出することができる。
【図面の簡単な説明】
【0014】
図1】本発明の一実施形態における中継区間抽出装置の構成を示す機能ブロック図である。
図2】同実施形態のニューステキストの例を示す図である。
図3】同実施形態の文解析データの例を示す図である。
図4】同実施形態の中継区間データの例を示す図である。
図5】同実施形態の中継区間抽出装置による中継区間抽出処理のフローチャートを示す図である。
図6】同実施形態の場所特定部による場所特定処理のフローチャートを示す図である。
図7】同実施形態の第一文分類部による第一文分類処理のフローチャートを示す図である。
図8】同実施形態の第二文分類部による第二文分類処理のフローチャートを示す図である。
図9】同実施形態の現地レポーター中継区間抽出部による現地レポーター中継区間抽出処理のフローチャートを示す図である。
図10】同実施形態のレポーター不在中継区間抽出部によるレポーター不在中継区間抽出処理のフローチャートを示す図である。
【発明を実施するための形態】
【0015】
以下、図面を参照しながら本発明の実施形態を詳細に説明する。
【0016】
[概要]
テレビ等で放送されるニュース番組には、スタジオでアナウンサーが説明するシーン以外に、レポーターが中継現場である現地から説明する中継、レポーターが現地に不在の中継、ヘリコプター等からの空撮による中継などのシーンが含まれる。レポーターが現地に不在の中継には、人がカメラで撮影する中継のほか、ロボットカメラにより撮影する中継などがある。本実施形態では、ニュース番組に付随する字幕放送などのテキストデータを利用して、ニュース番組の中からこれらの中継のシーンの抽出及び分類を行う。これにより、ニュース番組がどの場所からどのような形態で報道されたかという情報を取得することができる。
【0017】
[中継区間抽出装置の構成]
図1は、本発明の一実施形態による中継区間抽出装置1の構成を示す機能ブロック図である。中継区間抽出装置1は、例えば、1台または複数台のコンピュータ装置により実現され、同図に示すように、記憶部10、場所特定部11、文分類部12、中継区間抽出部15、及びノイズ除去部19を備えて構成される。中継区間抽出装置1には、ニューステキストが入力される。ニューステキストとは、ニュース番組の映像(動画)データに対応付けられたテキストデータであり、ニュース番組に付随する字幕放送でもよく、ニュース番組の音声を音声認識した結果であってもよい。なお、ニュース番組には1つのトピック(ニュース項目)のみが含まれていてもよく、複数のトピックが含まれていてもよい。
【0018】
記憶部10は、ニューステキスト、文解析データ、中継区間データなどの各種データを記憶する。文解析データは、ニューステキストにより示される各文の文解析結果を示す。中継区間データは、中継の形態、番組における中継区間の開始位置及び終了位置、中継の場所を示す。中継の形態には、現地からレポーターが説明する中継(以下、「現地レポーター中継」と記載する。)、レポーターが現地に不在の中継(以下、「レポーター不在中継」と記載する。)、空撮による中継(以下、「空撮中継」と記載する。)がある。
【0019】
場所特定部11は、ニューステキストにより示される各文から場所に関する語句を抽出し、抽出した語句から場所を特定する。本実施形態では、場所特定部11は、場所に関する語句である地名やランドマーク名から、場所を特定する情報として市区町村名などの場所名を取得する。なお、場所を特定する情報として、市区町村を特定するコードなどを用いてもよい。場所特定部11は、各文について得られた場所名を示す文解析データを記憶部10に書き込む。
【0020】
文分類部12は、第一文分類部13及び第二文分類部14を備え、ニューステキストにより示される各文が中継に関する表現を使用したコメントであるか否かを判定し、判別結果を記憶部10が記憶する文解析データに書き込む。第一文分類部13は、ニューステキストにより示される各文が、場所を特定する表現を使用したコメントであるか否か、映像を説明する表現を使用したコメントであるか否かを判定する。第二文分類部14は、ニューステキストにより示される各文が、現地からの中継の振りコメントであるか否か、現地からの中継の入りコメントであるか否か、現地からの中継の締めコメントであるか否かを判定する。
【0021】
中継区間抽出部15は、中継に関する表現を使用したコメントであると判定された2つの文それぞれのコメントの種類と、それらの2つの文それぞれについて特定された場所が相違するか否かとに基づいて、中継区間を抽出する。中継区間抽出部15は、抽出した中継区間の中継の形態、開始位置及び終了位置、ならびに中継の場所を設定した中継区間データを記憶部10に書き込む。中継区間抽出部15は、現地レポーター中継区間抽出部16、レポーター不在中継区間抽出部17、及び空撮中継区間抽出部18を備える。現地レポーター中継区間抽出部16は、第一文分類部13及び第二文分類部14による判別結果と、場所特定部11により特定された場所とに基づいて、現地レポーター中継区間と中継の場所を抽出する。レポーター不在中継区間抽出部17は、現地レポーター中継区間抽出部16による抽出結果と、第一文分類部13による判別結果と、場所特定部11により特定された場所とに基づいて、レポーター不在中継区間と中継の場所を抽出する。空撮中継区間抽出部18は、現地レポーター中継区間抽出部16により抽出された現地レポーター中継区間と、レポーター不在中継区間抽出部17により抽出されたレポーター不在中継区間とから、空撮中継区間を抽出する。ノイズ除去部19は、現地レポーター中継区間抽出部16が抽出した現地レポーター中継区間、レポーター不在中継区間抽出部17が抽出したレポーター不在中継区間、空撮中継区間抽出部18が抽出した空撮中継区間の中から、実際は中継区間ではないノイズを除外する。
【0022】
図2は、ニューステキストの例を示す図である。同図に示すように、ニューステキストは、ニュース番組の映像データに対応した文を示すテキストデータであり、映像データとの対応付けを示す同期データが付加される。同期データは、例えば、映像データの先頭からの再生時刻により示される。
【0023】
図3は、記憶部10に記憶される文解析データを示す図である。同図に示すように、文解析データを構成する各レコードは、文番号と、この文番号の文から特定された場所、及び、この文番号の文の種類を示す。文番号iは、ニューステキストにi番目に出現する文であることを示す。場所には、市区町村名が設定される。文の種類は、関数Kind1S(i)、及び関数Kind2S(i)の値によって表される。Kind1S(i)には、第一文分類部13による判別結果が設定され、Kind2S(i)には、第二文分類部14による判別結果が設定される。
【0024】
図4は、記憶部10に記憶される中継区間データを示す図である。同図に示すように中継区間データを構成する各レコードは、中継の形態、中継区間の開始位置及び終了位置、ならびに、中継の場所を示す。中継の形態は、現地レポーター中継、レポーター不在中継、あるいは、空撮中継である。中継区間の開始位置及び終了位置は文番号により示され、開始位置の文番号に対応した同期データが示す再生時刻から終了位置の文番号に対応した同期データが示す再生時刻までが映像データにおける中継区間である。なお、中継区間の開始位置及び終了位置として、開始位置の文及び終了位置の文に対応した同期データが示す再生時刻を設定してもよい。
【0025】
[中継区間抽出装置の動作]
続いて、中継区間抽出装置1の動作を説明する。
図5は、図1に示す中継区間抽出装置1による中継区間抽出処理の処理手順を示すフローチャートである。まず、中継区間抽出装置1に、ニュース番組に付随する字幕放送がニューステキストとして入力される。ニューステキストはn個(nは1以上の整数)の文を示し、ニューステキストが示すi番目(iは1以上n以下の整数)の文を文S(i)と記載する。記憶部10は、入力されたニューステキストを記憶する。
【0026】
<ステップS1−1:場所特定処理>
場所特定部11は、入力されたニューステキストにより示される各文から地名やランドマーク名を抽出し、市区町村名を特定する。この詳細な処理を、図6を用いて説明する。
【0027】
図6は、場所特定部11による場所特定処理の処理手順を示すフローチャートであり、図5のステップS1−1の詳細な処理手順を示す。
まず場所特定部11は、処理対象の文を文頭とするため、iに1を代入する(ステップS2−1)。次に、場所特定部11は、処理対象となっているi番目の文S(i)から、地名とランドマーク名(ランドマークの名称や呼称)を抽出する(ステップS2−2)。この抽出処理には、例えば、既存の固有名抽出器(「http://code.google.com/p/cabocha/」に示すcabochaなど)を利用することができる。
【0028】
続いて、場所特定部11は、ステップS2−2において抽出した地名やランドマーク名から市区町村を特定する(ステップS2−3)。市区町村を特定するために、例えば、記憶部10に予め、全国の地名やランドマーク名と対応付けて市区町村名を記憶させておく。場所特定部11は、ステップS2−2において抽出した地名やランドマーク名に対応付けられた市区町村名を記憶部10から読み出す。これにより、例えば、場所特定部11は、ステップS2−2において「気仙沼」という地名を抽出した場合、ステップS2−3において「気仙沼」は「宮城県気仙沼市」であると特定する。
【0029】
なお、ステップS2−2において抽出した地名やランドマーク名に対応した市区町村が複数存在する場合がある。この場合、場所特定部11は、それらを市区町村の候補としておく。場所特定部11は、文内の共起数を基準とした従来手法などを利用し、候補の中から市区町村を特定する。例えば、ステップS2−2において、「大船渡」という地名が抽出された場合、「岐阜県下呂市金山町大船渡」、「岩手県大船渡市大船渡町」、「新潟県燕市大船渡」の3つの市区町村が候補となる。場所特定部11は、現在の処理対象の文S(i)に地名が含まれている場合、3つの市区町村の候補の中からその地名との包含関係や共起頻度に応じて市区町村を特定する。例えば、場所特定部11は、現在の処理対象の文S(i)に「岩手県」という地名の単語があった場合、候補の中から「岩手県」が含まれる「岩手県大船渡市大船渡町」を市区町村として特定する。あるいは、例えば、場所特定部11は、現在の処理対象の文S(i)に「東北」という地名の単語があった場合、候補の中から「東北」との共起頻度が高い「岩手県」が含まれる「岩手県大船渡市大船渡町」を市区町村として特定する。このように、場所特定部11は、同じ文内に出現する地名を手掛かりとして、候補の中から一つの市区町村を特定する。なお、出現順が近い文同士は関連が高いことから、同じ文内に地名が含まれていない場合には、処理対象の文から所定範囲の前後の文に出現する地名を用いて、候補の中から市区町村を特定する。このとき、地名が出現する文のうち処理対象の文に最も近い文に出現する地名を利用して候補の中から市区町村を特定してもよく、所定範囲の前後の文に出現する地名のうち共起数が多い地名を利用して、候補の中から市区町村を特定してもよい。
【0030】
また、ステップS2−2においてランドマーク名が抽出された場合、場所特定部11は、既存の地図検索サービスを利用して市区町村を特定するようにしてもよい。例えば、「お台場」などは住所では無く呼称である。場所特定部11は、ウェブ上で提供されている地図検索サービス(例えば、Google map APIなど)を使うことにより、抽出されたランドマーク名「お台場」の緯度経度情報を取得し、取得した緯度経度情報から市区町村が「東京都港区」であると特定する。緯度経度情報からの市区町村の特定には、再度、既存の地図検索サービス(例えば、Google map APIなど)を使って緯度経度情報から市区町村名を取得する方法や、記憶部10に予め登録しておいた全国の市区町村の緯度経度情報を検索する方法などを用いることができる。
【0031】
場所特定部11は、文解析データがまだ生成されていない場合は、新たに文解析データを生成して記憶部10に登録する。場所特定部11は、文解析データに文番号iのレコードを追加し、場所の情報として市区町村名を書き込む。ただし、市区町村が特定されなかった場合、場所特定部11は、場所の情報をNULLのままとする。
【0032】
場所特定部11は、iがnより小さいか否かを判定することにより、ニューステキストに含まれる全ての文が処理されたかを判別する(ステップS2−4)。場所特定部11は、iがnより小さく、まだ処理されていない文があると判定した場合(ステップS2−4:YES)、iに1を加算して処理対象の文を後ろに一つずらし(ステップS2−5)、ステップS2−2からの処理を繰り返す。そして、場所特定部11は、iがnに達し、ニューステキストが示す全ての文について処理を終了したと判定した場合(ステップS2−4:NO)、図5のステップS1−1の処理を終了する。
【0033】
<ステップS1−2:第一文分類処理>
図5のステップS1−2において、第一文分類部13は、ニューステキストにより示される各文が、場所を特定するコメントである否か、映像を説明するコメントである否かを判定する。この詳細な処理を、図7を用いて説明する。
【0034】
図7は、第一文分類部13による第一文分類処理の処理手順を示すフローチャートであり、図5のステップS1−2の詳細な処理手順を示す。
まず、第一文分類部13は、処理対象の文を文頭とするため、iに1を代入する(ステップS3−1)。次に、第一文分類部13は、処理対象となっているi番目の文S(i)が、場所を特定するコメントであるか否かを判定する(ステップS3−2)。場所を特定するコメントとは、映像について直接場所の情報を伝えるようなコメントであり、例えば、「現在の気仙沼の様子です。」、「県庁の映像です。」などである。そこで、場所を特定するコメントと場所を特定しないコメントとを学習データとして用意し、SVM(サポートベクターマシン)などの機械学習により、場所を特定するコメントの特徴を予め学習しておく。第一文分類部13は、この学習結果を利用して、文S(i)が、場所を特定するコメントであるか否かを判定する。特徴としては、文に出現する単語や、その係り受けなどの情報を利用することができる。例えば、「現在の気仙沼の様子です。」であれば、「現在」、「気仙沼」、「の」、「様子」、「です」などの単語や、「気仙沼」の「様子」などの係り受けに基づいて、場所を特定するコメントであると判定される。
【0035】
第一文分類部13は、文S(i)が場所を特定するコメントであると判定した場合(ステップS3−2:YES)、文S(i)の種類を表す関数Kind1(S(i))に、「場所特定コメント」であることを示す値を設定する(ステップS3−3)。つまり、第一文分類部13は、文解析データの文番号iのレコードに含まれるKind1(S(i))に、「場所特定コメント」であることを示す値を書き込む。第一文分類部13は、Kind1(S(i))の値を設定した後、ステップS3−6の処理に進む。
【0036】
一方、文S(i)が場所を特定するコメントではないと判定した場合(ステップS3−2:NO)、第一文分類部13は、ステップS3−4の処理を行う。すなわち、第一文分類部13は、i番目の文S(i)が、映像を説明するコメントであるか否かを判定する(ステップS3−4)。映像を説明するコメントとは、映像中で発生している事象などについてのコメントであり、例えば、「今、岸壁の上には車が走っている様子も見えます。」、「画面の右隅にはプールが見えます。」などである。そこで、映像を説明するコメントと映像を説明しないコメントとを学習データとして用意し、SVMなどの機械学習により、映像を説明するコメントの特徴を予め学習しておく。第一文分類部13は、この学習結果を利用して、文S(i)が、映像を説明するコメントであるか否かを判定する。特徴としては、文に出現する単語や、その係り受けなどの情報を利用することができる。
【0037】
第一文分類部13は、文S(i)が映像を説明するコメントであると判定した場合(ステップS3−4:YES)、文解析データの文番号iのレコードに含まれるKind1(S(i))に、「映像コメント」であることを示す値を設定する(ステップS3−5)。第一文分類部13は、Kind1(S(i))の値を設定した後、ステップS3−6に進む。
また、第一文分類部13は、文S(i)が映像を説明するコメントではないと判定した場合(ステップS3−4:NO)、ステップS3−6に進む。
【0038】
ステップS3−3またはステップS3−5の処理の後、あるいは、ステップS3−4の処理でNOと判定した場合、第一文分類部13は、iがnより小さいか否かを判定することにより、ニューステキストに含まれる全ての文が処理されたかを判別する(ステップS3−6)。第一文分類部13は、iがnより小さく、まだ処理されていない文があると判定した場合(ステップS3−6:YES)、iに1を加算して処理対象の文を後ろに一つずらし(ステップS3−7)、ステップS3−2からの処理を繰り返す。そして、第一文分類部13は、iがnに達し、ニューステキストが示す全ての文について処理を終了したと判定した場合(ステップS3−6:NO)、図5のステップS1−2の処理を終了する。
【0039】
<ステップS1−3:第二文分類処理>
図5のステップS1−3において、第二文分類部14は、ニューステキストにより示される各文が、現場中継の振りコメントであるか否か、現場中継の入りコメントであるか否か、現場中継の締めコメントであるか否かを判定する。この詳細な処理を、図8を用いて説明する。
【0040】
図8は、第二文分類部14による第二文分類処理の処理手順を示すフローチャートであり、図5のステップS1−3の詳細な処理を示す。
まず、第二文分類部14は、処理対象の文を文頭とするため、iに1を代入する(ステップS4−1)。次に、第二文分類部14は、処理対象となっているi番目の文S(i)が、現場からの中継の振りコメントであるか否かを判定する(ステップS4−2)。現場からの中継の振りコメントとは、ニュース番組で中継に入る際にスタジオのアナウンサーが発するコメントであり、例えば、「それではここで、岩手県の大船渡の避難所から中継でお伝えします。」、「それでは東京の新宿駅の南口から中継でお伝えします。」などである。そこで、現場からの中継の振りコメントとそうではないコメントとを学習データとして用意し、SVMなどの機械学習により、現場からの中継の振りコメントの特徴を予め学習しておく。第二文分類部14は、この学習結果を利用して、文S(i)が、現場からの中継の振りコメントであるか否かを判定する。特徴としては、文に出現する単語や、その係り受けなどの情報を利用することができる。
【0041】
第二文分類部14は、文S(i)が現場からの中継の振りコメントであると判定した場合(ステップS4−2:YES)、文S(i)の種類を表す関数Kind2(S(i))に、「中継振りコメント」であることを示す値を設定する(ステップS4−3)。つまり、第二文分類部14は、文解析データの文番号iのレコードに含まれるKind2(S(i))に、「中継振りコメント」であることを示す値を書き込む。第二文分類部14は、Kind2(S(i))の値を設定した後、ステップS4−8に進む。
【0042】
一方、第二文分類部14は、文S(i)が現場からの中継の振りコメントではないと判定した場合(ステップS4−2:NO)、処理対象となっているi番目の文S(i)が現場からの中継の入りコメントであるか否かを判定する(ステップS4−4)。現場からの中継の入りコメントとは、ニュース番組で中継に入る際に現地のアナウンサーや記者が最初に発するコメントであり、例えば、「岩手県沿岸高台にある大船渡第一病院です。」、「仙台駅です。」などである。そこで、予め現場からの中継の入りコメントとそうではないコメントとを学習データとして用意し、SVMなどの機械学習により、現場からの中継の入りコメントの特徴を学習しておく。第二文分類部14は、この学習結果を利用して、文S(i)が、現場からの中継の入りコメントであるか否かを判定する。特徴としては、文に出現する単語や、その係り受けなどの情報を利用することができる。
【0043】
第二文分類部14は、文S(i)が現場からの中継の入りコメントであると判定した場合(ステップS4−4:YES)、文解析データの文番号iのレコードに含まれるKind2(S(i))に、「中継入りコメント」であることを示す値を設定する(ステップS4−5)。第二文分類部14は、Kind2(S(i))の値を設定した後、ステップS4−8に進む。
【0044】
一方、第二文分類部14は、文S(i)が現場からの中継の入りコメントではないと判定した場合(ステップS4−4:NO)、処理対象となっているi番目の文S(i)が現場からの中継の締めコメントであるか否かを判定する(ステップS4−6)。現場からの中継の締めコメントとは、ニュース番組における中継の際に現地のアナウンサーや記者が最後に発するコメントであり、例えば、「以上、岩手県の大船渡第一病院でした。」、「新宿駅南口からお伝えしました。」などである。そこで、現場からの中継の締めコメントとそうではないコメントとを学習データとして用意し、SVMなどの機械学習により、現場からの中継の締めコメントの特徴を予め学習しておく。第二文分類部14は、この学習結果を利用して、文S(i)が、現場からの中継の締めコメントであるか否かを判定する。特徴としては、文に出現する単語や、その係り受けなどの情報を利用することができる。
【0045】
第二文分類部14は、文S(i)が現場からの中継の締めコメントであると判定した場合(ステップS4−6:YES)、文解析データの文番号iのレコードに含まれるKind2(S(i))に、「中継締めコメント」であることを示す値を設定する(ステップS4−7)。第二文分類部14は、Kind2(S(i))の値を設定した後、ステップS4−8に進む。
また、第二文分類部14は、文S(i)が現場からの中継の締めコメントではないと判定した場合(ステップS4−6:NO)、ステップS4−8に進む。
【0046】
ステップS4−3、ステップS4−5、または、ステップS4−7の処理の後、あるいは、ステップS4−6の処理でNOと判定した場合、第二文分類部14は、iがnより小さいか否かを判定することにより、ニューステキストに含まれる全ての文が処理されたかを判別する(ステップS4−8)。第二文分類部14は、iがnより小さく、まだ処理されていない文があると判定した場合(ステップS4−8:YES)、iに1を加算して処理対象の文を後ろに一つずらし(ステップS4−9)、ステップS4−2からの処理を繰り返す。そして、第二文分類部14は、iがnに達し、ニューステキストが示す全ての文について処理を終了したと判定した場合(ステップS4−8:NO)、図5のステップS1−3の処理を終了する。
【0047】
[ステップS1−4:現地レポーター中継区間抽出処理]
図5のステップS1−4において、現地レポーター中継区間抽出部16は、場所特定処理(ステップS1−1)の処理結果と、第一文分類処理の処理結果(ステップS1−2)と、第二文分類処理の処理結果(ステップS1−3)とに基づいて、現地レポーター中継区間と中継の場所を抽出する。この詳細な処理を、図9を用いて説明する。
【0048】
図9は、現地レポーター中継区間抽出部16による現地レポーター中継区間抽出処理の処理手順を示すフローチャートであり、図5のステップS1−4の詳細な処理手順を示す。
まず、現地レポーター中継区間抽出部16は、処理対象の文を文末とするため、iにnを代入する(ステップS5−1)。次に、現地レポーター中継区間抽出部16は、処理対象となっているi番目の文S(i)が「中継締めコメント」であるか否かを、文解析データに設定されているKind2(S(i))が「中継締めコメント」を示す値であるか否かにより判定する(ステップS5−2)。現地レポーター中継区間抽出部16は、文S(i)が「中継締めコメント」であると判定した場合(ステップS5−2:YES)、中継区間特定処理を行う(ステップS5−3)。
【0049】
ステップS5−3ではまず、現地レポーター中継区間抽出部16は、「中継締めコメント」である文S(i)より前の文を、1文ずつm文まで遡り(例えば、m=50)、「中継振りコメント」の文を探索する。つまり、現地レポーター中継区間抽出部16は、文解析データを参照し、kを1からmまで1ずつ増やしながら、Kind2(S(i−k))が「中継振りコメント」を示す値である文S(i−k)を探索する。「中継振りコメント」の文S(i−k)が見つかり、かつ、文S(i)について特定された市区町村名と文S(i−k)について特定された市区町村名とに相違が無い場合、現地レポーター中継区間抽出部16は、「中継振りコメント」の文S(i−k)から「中継締めコメント」の文S(i)までを「現地レポーター中継区間」と判定する。文S(i)について特定された市区町村名、文S(i−k)について特定された市区町村名はそれぞれ、文解析データの文番号iのレコード、文番号(i−k)のレコードから読み出される。なお、現地レポーター中継区間抽出部16は、文S(i)または文S(i−k)の少なくとも一方について市区町村名が特定されていない場合や、「岩手県大船渡市大船渡町」と「岩手県」のように、市区町村名に包含関係がある場合も、市区町村名に相違がないと判断する。これは、以下の処理において、市区町村名や地名に相違がないと判断する場合も同様である。現地レポーター中継区間抽出部16は、中継の場所を、文S(i)または文S(i−k)について特定された市区町村名の場所であると判断する。現地レポーター中継区間抽出部16は、中継区間データがまだ生成されていない場合は、新たに中継区間データを生成して記憶部10に登録する。現地レポーター中継区間抽出部16は、中継区間データにレコードを追加し、「現地レポーター中継」を示す中継の形態と、文番号(i−k)を示す開始位置と、文番号kを示す終了位置と、中継の場所とを書き込む。
【0050】
m文まで遡っても「中継振りコメント」の文が見つからなかった場合、現地レポーター中継区間抽出部16は、「中継締めコメント」である文S(i)より前の文を、1文ずつm文まで遡り(例えば、m=50)、「中継入りコメント」の文を探索する。つまり、現地レポーター中継区間抽出部16は、文解析データを参照し、kを1からmまで1ずつ増やしながら、Kind2(S(i−k))が「中継入りコメント」を示す値である文S(i−k)を探索する。「中継入りコメント」の文S(i−k)が見つかった場合、現地レポーター中継区間抽出部16は、「中継入りコメント」の文S(i−k)から「中継締めコメント」の文S(i)までを「現地レポーター中継区間」と判定する。また、現地レポーター中継区間抽出部16は、この中継の場所を、文S(i)または文S(i−k)について特定された市区町村名の場所であると判断する。現地レポーター中継区間抽出部16は、中継区間データにレコードを追加し、「現地レポーター中継」を示す中継の形態と、文番号(i−k)を示す開始位置と、文番号kを示す終了位置と、中継の場所とを書き込む。
【0051】
m文まで遡っても「中継振りコメント」の文も「中継入りコメント」の文もともに見つからない場合、現地レポーター中継区間抽出部16は、ニューステキストを参照し、文S(i)より前の文を1文ずつm文まで遡り(例えば、m=50)、「“地名”です。」という文末表現の文S(i−k)を探索する(kは1以上m以下の整数)。「“地名”です。」という文末表現の文S(i−k)が見つかり、かつ、その文に含まれる地名が、文S(i)について特定された市区町村名と相違が無い場合、現地レポーター中継区間抽出部16は、文S(i−k)から「中継締めコメント」の文S(i)までを現地レポーター中継区間と判定する。現地レポーター中継区間抽出部16は、中継の場所を、文S(i)について特定された市区町村名の場所、あるいは、文S(i−k)に含まれる地名(または、その地名から特定される市区町村名)の場所であると判断する。現地レポーター中継区間抽出部16は、中継区間データにレコードを追加し、「現地レポーター中継」を示す中継の形態と、文番号(i−k)を示す開始位置と、文番号kを示す終了位置と、中継の場所とを書き込む。
【0052】
ステップS5−3の処理の後、あるいは、ステップS5−2において文S(i)が「中継締めコメント」ではないと判定した場合(ステップS5−2:NO)、現地レポーター中継区間抽出部16は、ステップS5−4の処理を行う。すなわち、現地レポーター中継区間抽出部16は、iが1より大きいか否かを判定することにより、ニューステキストに含まれる全ての文が処理されたかを判別する(ステップS5−4)。現地レポーター中継区間抽出部16は、iが1より大きく、まだ処理されていない文があると判定した場合(ステップS5−4:YES)、iから1を減算して処理対象の文を前に一つずらし(ステップS5−5)、ステップS5−2からの処理を繰り返す。そして、現地レポーター中継区間抽出部16は、iが1に達し、ニューステキストが示す全ての文について処理を終了したと判定した場合(ステップS5−4:NO)、ステップS5−6の処理に進む。
【0053】
現地レポーター中継区間抽出部16は、処理対象となっているi番目の文S(i)が「中継振りコメント」であるか否かを、文解析データに設定されているKind2(S(i))が「中継振りコメント」を示す値であるか否かにより判定する(ステップS5−6)。現地レポーター中継区間抽出部16は、文S(i)が「中継振りコメント」であると判定した場合(ステップS5−6:YES)、中継区間特定処理を行う(ステップS5−7)。
【0054】
ステップS5−7において、現地レポーター中継区間抽出部16は、「中継振りコメント」である文S(i)より後ろの文を、1文ずつm文まで進め(例えば、m=50)、「場所特定コメント」またはニュース番組の句切れ目を指すようなコメントの文S(i+k)を探索する(kは1以上m以下の整数)。「場所特定コメント」であるか否かは、文解析データに設定されているKind1(S(i+k))が「場所特定コメント」を示す値であるか否かによって判定される。また、ニュース番組の句切れ目を指すようなコメントは、例えば、「中継でした。」、「引き続きお伝えします。」などのコメントである。「場所特定コメント」またはニュース番組の句切れ目を指すようなコメントの文S(i+k)が見つかった場合、現地レポーター中継区間抽出部16は、「中継振りコメント」の文S(i)から、文S(i+k)の直前の文S(i+k−1)までを、現地レポーター中継区間と判定する。現地レポーター中継区間抽出部16は、中継の場所を文S(i)について特定された市区町村名の場所、あるいは、「場所特定コメント」の文S(i+k−1)について特定された市区町村名の場所であると判断する。現地レポーター中継区間抽出部16は、中継区間データにレコードを追加し、「現地レポーター中継」を示す中継の形態と、文番号iを示す開始位置と、文番号(i+k−1)を示す終了位置と、中継の場所とを書き込む。
【0055】
ステップS5−7の処理の後、あるいは、ステップS5−6において文S(i)が「中継振りコメント」ではないと判定した場合(ステップS5−6:NO)、現地レポーター中継区間抽出部16は、ステップS5−8の処理を行う。すなわち、現地レポーター中継区間抽出部16は、iがnより小さいか否かを判定することにより、ニューステキストに含まれる全ての文が処理されたかを判別する(ステップS5−8)。現地レポーター中継区間抽出部16は、iがnより小さく、まだ処理されていない文があると判定した場合(ステップS5−8:YES)、iに1を加算して処理対象の文を後ろに一つずらし(ステップS5−9)、ステップS5−6からの処理を繰り返す。そして、現地レポーター中継区間抽出部16は、iがnに達し、ニューステキストが示す全ての文について処理を終了したと判定した場合(ステップS5−8:NO)、図5のステップS1−4の処理を終了する。
【0056】
上記のように、現地レポーター中継区間抽出部16は、まずは、検出の精度が高い中継締めコメントを利用して現地レポーター中継区間を抽出し、中継締めコメントが検出されない現地レポーター中継区間については、次に検出の精度が高い中継振りコメントを利用して抽出する。
【0057】
[ステップS1−5:レポーター不在中継区間抽出処理]
図5のステップS1−5において、レポーター不在中継区間抽出部17は、場所特定処理(ステップS1−1)の処理結果と、第一文分類処理(ステップS1−2)の処理結果と、現地レポーター中継区間抽出処理(ステップS1−4)の処理結果とに基づいて、レポーター不在中継区間と中継の場所を抽出する。この詳細な処理を、図10を用いて説明する。
【0058】
図10は、レポーター不在中継区間抽出部17によるレポーター不在中継区間抽出処理の処理手順を示すフローチャートであり、図5のステップS1−5の詳細な処理手順を示す。
まず、レポーター不在中継区間抽出部17は、処理対象の文を文頭とするため、iに1を代入する(ステップS6−1)。次に、レポーター不在中継区間抽出部17は、処理対象となっているi番目の文S(i)が現地レポーター中継区間に含まれているか否かを、中継区間データに中継の形態「現地レポーター中継」と対応付けて設定されている開始位置から終了位置までに文番号iが含まれているか否かにより判定する(ステップS6−2)。レポーター不在中継区間抽出部17は、文S(i)が現地レポーター中継区間に含まれていないと判定した場合(ステップS6−2:NO)、文S(i)が「場所特定コメント」であるか否かを、文解析データに設定されているKind1(S(i))が「場所特定コメント」を示す値であるか否かにより判定する(ステップS6−3)。レポーター不在中継区間抽出部17は、文S(i)が「場所特定コメント」であると判定した場合(ステップS6−3:YES)、中継区間特定処理を行う(ステップS6−4)。
【0059】
ステップS6−4ではまず、レポーター不在中継区間抽出部17は、「場所特定コメント」である文S(i)より後ろの文を、1文ずつm文まで進め(例えば、m=50)、「場所特定コメント」の文を探索する。つまり、レポーター不在中継区間抽出部17は、文解析データを参照し、kを1からmまで1ずつ増やしながら、Kind1(S(i+k))が「場所特定コメント」を示す値である文S(i+k)を探索する。「場所特定コメント」の文S(i+k)が見つかり、かつ、文S(i)について特定された市区町村名と文S(i+k)について特定された市区町村名とに相違が無い場合、レポーター不在中継区間抽出部17は、「場所特定コメント」の文S(i)から文S(i+k)までを、「レポーター不在中継区間」と判定する。文S(i)について特定された市区町村名、文S(i+k)について特定された市区町村名のそれぞれは、文解析データの文番号iのレコード、文番号(i+k)のレコードから読み出される。レポーター不在中継区間抽出部17は、中継の場所を、文S(i)または文S(i+k)について特定された市区町村名の場所であると判断する。レポーター不在中継区間抽出部17は、中継区間データにレコードを追加し、「レポーター不在中継」を示す中継の形態と、文番号(i)を示す開始位置と、文番号(i+k)を示す終了位置と、中継の場所とを書き込む。
【0060】
m文先まで探索しても「場所特定コメント」の文が見つからなかった場合、レポーター不在中継区間抽出部17は、「場所特定コメント」である文S(i)より後ろの文を、1文ずつm文まで進め(例えば、m=50)、「映像コメント」の文を探索する。つまり、レポーター不在中継区間抽出部17は、文解析データを参照し、kを1からmまで1ずつ増やしながら、Kind1(S(i+k))が「映像コメント」を示す値である文S(i+k)を探索する。「映像コメント」の文S(i+k)が見つかり、かつ、文S(i)について特定された市区町村名と文S(i+k)について特定された市区町村名とに相違が無い場合、レポーター不在中継区間抽出部17は、「場所特定コメント」の文S(i)から文S(i+k)までを、「レポーター不在中継区間」と判定する。また、レポーター不在中継区間抽出部17は、中継の場所を、文S(i)または文S(i+k)について特定された市区町村名の場所であると判断する。レポーター不在中継区間抽出部17は、中継区間データにレコードを追加し、「レポーター不在中継」を示す中継の形態と、文番号iを示す開始位置と、文番号(i+k)を示す終了位置と、中継の場所とを書き込む。
【0061】
ステップS6−2において文S(i)が現地レポーター中継区間に含まれると判定した場合(ステップS6−2:YES)、ステップS6−3において文S(i)が「場所特定コメント」ではないと判定した場合(ステップS6−3:NO)、あるいは、ステップS6−4の処理の後、レポーター不在中継区間抽出部17は、ステップS6−5の処理を行う。すなわち、レポーター不在中継区間抽出部17は、iがnより小さいか否かを判定することにより、ニューステキストに含まれる全ての文が処理されたかを判別する(ステップS6−5)。レポーター不在中継区間抽出部17は、iがnより小さく、まだ処理されていない文があると判定した場合(ステップS6−5:YES)、iに1を加算して処理対象の文を後ろに一つずらし(ステップS6−6)、ステップS6−2からの処理を繰り返す。そして、レポーター不在中継区間抽出部17は、iがnに達し、ニューステキストが示す全ての文について処理を終了したと判定した場合(ステップS6−5:NO)、ステップS6−7の処理に進む。
【0062】
レポーター不在中継区間抽出部17は、処理対象の文を文頭とするため、iに1を代入する(ステップS6−7)。次に、レポーター不在中継区間抽出部17は、ステップS6−2と同様に、処理対象となっているi番目の文S(i)が現地レポーター中継区間に含まれているか否かを判定する(ステップS6−8)。レポーター不在中継区間抽出部17は、文S(i)が現地レポーター中継区間に含まれていないと判定した場合(ステップS6−8:NO)、文S(i)が「映像コメント」であるか否かを、文解析データに設定されているKind1(S(i))が「映像コメント」を示す値であるか否かにより判定する(ステップS6−9)。レポーター不在中継区間抽出部17は、文S(i)が「映像コメント」であると判定した場合(ステップS6−9:YES)、中継区間特定処理を行う(ステップS6−10)。
【0063】
ステップS6−10において、レポーター不在中継区間抽出部17は、「映像コメント」である文S(i)より後ろの文を、1文ずつm文まで進め(例えば、m=10)、「映像コメント」の文を探索する。つまり、レポーター不在中継区間抽出部17は、文解析データを参照し、kを1からmまで1ずつ増やしながら、Kind1(S(i+k))が「映像コメント」を示す値である文S(i+k)を探索する。「映像コメント」の文S(i+k)が見つかり、かつ、文S(i)から特定された市区町村名と文S(i+k)から特定された市区町村名とに相違が無い場合、レポーター不在中継区間抽出部17は、「映像コメント」の文S(i)から文S(i+k)までを、「レポーター不在中継区間」と判定する。レポーター不在中継区間抽出部17は、中継の場所を、文S(i)または文S(i+k)から特定された市区町村名の場所であると判断する。レポーター不在中継区間抽出部17は、中継区間データにレコードを追加し、「レポーター不在中継」を示す中継の形態と、文番号iを示す開始位置と、文番号(i+k)を示す終了位置と、中継の場所とを書き込む。
【0064】
S6−8において文S(i)が現地レポーター中継区間に含まれると判定した場合(ステップS6−8:YES)、ステップS6−9において文S(i)が「映像コメント」ではないと判定した場合(ステップS6−9:NO)、あるいは、ステップS6−10の処理の後、レポーター不在中継区間抽出部17は、ステップS6−11の処理を行う。すなわち、レポーター不在中継区間抽出部17は、iがnより小さいか否かを判定することにより、ニューステキストに含まれる全ての文が処理されたかを判別する(ステップS6−11)。レポーター不在中継区間抽出部17は、iがnより小さく、まだ処理されていない文があると判定した場合(ステップS6−11:YES)、iに1を加算して処理対象の文を後ろに一つずらし(ステップS6−12)、ステップS6−8からの処理を繰り返す。そして、レポーター不在中継区間抽出部17は、iがnに達し、ニューステキストが示す全ての文について処理を終了したと判定した場合(ステップS6−11:NO)、図5のステップS1−5の処理を終了する。
【0065】
上記のように、レポーター不在中継区間抽出部17は、まずは、検出の精度が高い場所特定コメントを利用してレポーター不在中継区間を抽出し、場所特定コメントが検出されないレポーター不在中継区間については、映像コメントを利用して抽出する。また、レポーター不在中継区間抽出部17が抽出したレポーター不在中継区間として抽出した区間がすでに現地レポーター中継区間として抽出されていた場合、現地レポーター中継区間を優先する。
【0066】
[ステップS1−6:空撮中継区間抽出処理]
図5のステップS1−6において、空撮中継区間抽出部18は、現地レポーター中継区間抽出処理(ステップS1−4)とレポーター不在中継区間抽出処理(ステップS1−5)の結果抽出された中継区間から、空撮中継区間を抽出する。そこで、記憶部10に、「上空から」、「ヘリからの映像」、「ヘリコプターで撮影」といった空撮特有のコメントに用いられる語句をあらかじめ登録しておく。空撮中継区間抽出部18は、ステップS1−4において抽出された現地レポーター中継区間に対応したニューステキスト、及び、ステップS1−5において抽出されたレポーター不在中継区間に対応したニューステキストと、空撮特有のコメントの語句とを比較する。具体的には、空撮中継区間抽出部18は、記憶部10に記憶されている中継区間データの各レコード毎に、中継区間の開始位置及び終了位置を読み出し、読み出した開始位置及び終了位置までの区間に対応したニューステキストが示す文に、空撮特有のコメントの語句が含まれるか否かを判定する。空撮中継区間抽出部18は、空撮特有のコメントの語句が含まれていると判定した場合、そのレコードの中継の形態を、「現地レポーター中継」あるいは「レポーター不在中継」から、「空撮中継区間」に修正する。
【0067】
[ステップS1−7:ノイズ除去処理]
ステップS1−7において、ノイズ除去部19は、現地レポーター中継区間抽出処理(ステップS1−4)、レポーター不在中継区間抽出処理(ステップS1−5)、及び空撮中継区間抽出処理(ステップS1−6)の結果抽出された中継区間から、中継区間の時間の長さに基づいてノイズを除外する。具体的には、ノイズ除去部19は、記憶部10に記憶されている中継区間データの各レコードから、中継区間(現地レポーター中継区間、レポーター不在中継区間、または、空撮中継区間)の開始位置及び終了位置を読み出す。ノイズ除去部19は、記憶部10が記憶しているニューステキストに付加されている同期データから、開始位置が示す文に対応した同期データと、終了位置の文に対応した同期データを取得する。ノイズ除去部19は、終了位置の文に対応した同期データが示す再生時刻から、開始位置の文に対応した同期データが示す再生時刻を減算して、各中継区間の時間の長さを算出し、算出した時間の長さが一定以下(例えば10秒以下)の中継区間はノイズと判定する。ノイズ除去部19は、ノイズと判定された現地レポーター中継区間、レポーター不在中継区間、空撮中継区間のレコードを中継区間データから削除する。
【0068】
なお、ノイズ除去部19は、ノイズを判定する前に、連続する中継区間を1つの中継区間とする処理を行ってもよい。例えば、中継区間データの異なるレコードR1、R2において中継の形態が同じであり、かつ、レコードR1の終了位置と、レコードR2の開始位置とが連続している場合、レコードR1の終了位置をレコードR2の終了位置に書き換え、レコードR2を削除する。
【0069】
なお、映像データが複数のトピックを含んだニュース番組である場合、中継区間抽出装置1は、同一のトピックの映像データの区間内において中継区間を抽出するようにしてもよい。この場合、中継区間抽出装置1は、従来のアンカーショット検出手法により映像データからアンカーショットを抽出し、アンカーショットが抽出された部分が各トピックの先頭となるように映像データを分割する。
【0070】
上述した実施形態によれば、中継区間抽出装置は、ニュース番組の映像に付随したテキストデータにより示される各文から地名やランドマーク名など場所に関する語句を抽出し、場所を特定する。さらに中継区間抽出装置は、テキストデータにより示される各文が中継の場所を特定するコメント、あるいは中継の映像を説明するコメントであるかの判別と、中継入りコメント、中継振りコメント、あるいは中継締めコメントであるかの判別を行う。中継区間抽出装置は、各文から特定した場所と、各文の文分類処理の結果とに基づいて、テレビ等で放送されるニュース番組から、レポーターが現地から説明する中継、レポーターが現地に不在の中継、ヘリコプター等からの空撮による中継などのシーンの区間と、中継の場所を抽出する。これにより、ニュース番組がどの場所からどのような形態で報道されたかという情報を取得することができる。この取得した結果を地図上にマッピングすることにより、これらの中継が、どこから、どの程度の時間放送されたかを視覚的に把握することが可能となり、報道機関における情報整理に繋がる。
【0071】
なお、上述の中継区間抽出装置1は、内部にコンピュータシステムを有している。そして、中継区間抽出装置1の各部の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
【0072】
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【符号の説明】
【0073】
1 中継区間抽出装置
10 記憶部
11 場所特定部
12 文分類部
13 第一文分類部
14 第二文分類部
15 中継区間抽出部
16 現地レポーター中継区間抽出部
17 レポーター不在中継区間抽出部
18 空撮中継区間抽出部
19 ノイズ除去部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10