特許6994922 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 清水建設株式会社の特許一覧

特許6994922会話認識記録システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2021-12-16

(45)【発行日】2022-02-04

(54)【発明の名称】会話認識記録システム

(51)【国際特許分類】

G10L 25/78 20130101AFI20220128BHJP

G06Q 10/10 20120101ALI20220128BHJP

【ＦＩ】

G10L25/78

G06Q10/10

【請求項の数】 5

(21)【出願番号】P 2017234875

(22)【出願日】2017-12-07

(65)【公開番号】P2019101338

(43)【公開日】2019-06-24

【審査請求日】2020-11-04

(73)【特許権者】

【識別番号】000002299

【氏名又は名称】清水建設株式会社

(74)【代理人】

【識別番号】100139114

【弁理士】

【氏名又は名称】田中貞嗣

(74)【代理人】

【識別番号】100139103

【弁理士】

【氏名又は名称】小山卓志

(74)【代理人】

【識別番号】100119220

【弁理士】

【氏名又は名称】片寄武彦

(74)【代理人】

【識別番号】100091971

【氏名又は名称】米澤明

(74)【代理人】

【識別番号】100095120

【氏名又は名称】内田亘彦

(74)【代理人】

【識別番号】100088041

【氏名又は名称】阿部龍吉

(72)【発明者】

【氏名】松尾隆士

(72)【発明者】

【氏名】増田崇

【審査官】渡部幸和

(56)【参考文献】

【文献】特開２０１４－０８３６５８（ＪＰ，Ａ）

【文献】特開２０１０－２６６７２２（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１０Ｌ２５／００－２５／９３

Ｇ０６Ｑ１０／００－１０／１０

(57)【特許請求の範囲】

【請求項1】

複数の区画に分割された空間のそれぞれで会話が発生したか否かを認識し記録を行う会話認識記録システムにおいて、
情報処理装置に、
それぞれの区画で集音された音に音声が含まれるか否かを判定する音声判定ステップと、
それぞれの区画周辺で複数の人が存在するか否かを判定する人判定ステップと、
前記音声判定ステップにおいて、ある区画で集音された音に音声が含まれると判定され、かつ、前記人判定ステップにおいて、当該区画周辺で複数の人が存在すると判定されると当該区画で会話が発生したものと認識して記録を行う記録ステップと、を実行させることを特徴とする会話認識記録システム。

【請求項2】

前記音声判定ステップは、
集音された音に基づいて、設定された時間間隔帯におけるＡ特性等価音圧レベルと、中心周波数５００Ｈｚのオクターブバンド等価音圧レベルとを算出し、
中心周波数５００Ｈｚのオクターブバンド等価音圧レベルからＡ特性等価音圧レベルを引いた差分が予め設定された閾値以上である場合、集音された音に音声が含まれると判定することを特徴とする請求項１に記載の会話認識記録システム。

【請求項3】

前記人判定ステップが、カメラで取得された画像を解析することで、ある区画周辺で複数の人が存在するか否かを判定することを特徴とする請求項１又は請求項２に記載の会話認識記録システム。

【請求項4】

前記人判定ステップが、ＲＦＩＤタグを利用することで、ある区画周辺で複数の人が存在するか否かを判定することを特徴とする請求項１又は請求項２に記載の会話認識記録システム。

【請求項5】

前記人判定ステップが、人感センサーを利用することで、ある区画周辺で複数の人が存在するか否かを判定することを特徴とする請求項１又は請求項２に記載の会話認識記録システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、例えば、オフィス内におけるコミュニケーションの活性度の指標として会話の有無を認識し、これを記録する際に用い得る会話認識記録システムに関する。

【背景技術】

【0002】

建物空間内で発生する会話は人々のコミュニケーション量や知的生産性を測る指標として重要である。ある空間内に人が居るかコミュニケーションが活発に行われているかを判定する手段として、音声を検知することは有効な方法である。このような音声検知方法が確立されていれば、例えば、オフィス内のコミュニケーション活性度の計測を行ったり、或いは、公共施設などの交流ペースの活用度を計測したり、といったことが可能となる。

【0003】

業務に適したオフィス環境が提供されているかを知る尺度として、例えば、特許文献１（特開２０１６－１１５００３号公報）には、複数の種類の業務が各ユーザによってそれぞれ遂行されるように構成される施設におけるオフィス活動を分析するオフィス活動分析システムにおいて、対話などによる現場の音をセンサーであるマイクによって集音して、マイクで集音した音の音圧レベルがある値を超える場合や音圧レベルが変動する場合に会話が行われていると判断する技術が開示されている。

【文献】特開２０１６－１１５００３号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、特許文献１記載の従来技術においては、音圧レベルの変動から会話を推定するものであり、空間内では暗騒音を含む様々な音が発生することを考慮すると会話検知の精度が低くなる、という問題があった。

【0005】

さらに、従来技術のように音圧センサーだけでは空間内で発生する音圧レベルは測定できても、それが人の会話であるかそれ以外の音（騒音、電話ベルなど）によるものであるかは判断できず、精度高く、所定空間内で発生する会話の有無を認識することができず、問題であった。

【課題を解決するための手段】

【0006】

この発明は、上記のような問題を解決するものであって、本発明に係る会話認識記録システムは、複数の区画に分割された空間のそれぞれで会話が発生したか否かを認識し記録を行う会話認識記録システムにおいて、情報処理装置に、それぞれの区画で集音された音に音声が含まれるか否かを判定する音声判定ステップと、それぞれの区画周辺で複数の人が存在するか否かを判定する人判定ステップと、前記音声判定ステップにおいて、ある区画で集音された音に音声が含まれると判定され、かつ、前記人判定ステップにおいて、当該区画周辺で複数の人が存在すると判定されると当該区画で会話が発生したものと認識して記録を行う記録ステップと、を実行させることを特徴とする。

【0007】

また、本発明に係る会話認識記録システムは、前記音声判定ステップは、集音された音に基づいて、設定された時間間隔帯におけるＡ特性等価音圧レベルと、中心周波数５００Ｈｚのオクターブバンド等価音圧レベルとを算出し、中心周波数５００Ｈｚのオクターブバンド等価音圧レベルからＡ特性等価音圧レベルを引いた差分が予め設定された閾値以上である場合、集音された音に音声が含まれると判定することを特徴とする。

【0008】

また、本発明に係る会話認識記録システムは、前記人判定ステップが、カメラで取得された画像を解析することで、ある区画周辺で複数の人が存在するか否かを判定することを特徴とする。

【0009】

また、本発明に係る会話認識記録システムは、前記人判定ステップが、ＲＦＩＤタグを利用することで、ある区画周辺で複数の人が存在するか否かを判定することを特徴とする。

【0010】

また、本発明に係る会話認識記録システムは、前記人判定ステップが、人感センサーを利用することで、ある区画周辺で複数の人が存在するか否かを判定することを特徴とする。

【発明の効果】

【0011】

本発明に係る会話認識記録システムは、音声判定部において、ある区画で集音された音に音声が含まれると判定され、かつ、人判定部において、当該区画周辺で複数の人が存在すると判定されると当該区画で会話が発生したものと認識するものであり、このような本発明に係る会話認識記録システムによれば、所定の空間内にける会話の有無を高い精度で認識し、記録を行うことが可能となる。

【図面の簡単な説明】

【0012】

【図1】本発明の実施形態に係る会話認識記録システム１のオフィス１００への適用例を示す図である。

【図2】本発明の実施形態に係る会話認識記録システム１のブロック図を示す図である。

【図3】本発明の実施形態に係る会話認識記録システム１の設定時間間隔毎の処理アルゴリズムのフローチャートを示す図である。

【図4】音声判定サブルーチンのフローチャートを示す図である。

【図5】人判定サブルーチンのフローチャートを示す図である。

【図6】着目区画とその周辺の区画とを説明する図である。

【図7】本発明の実施形態に係る会話認識記録システム１による記録例を示す図である。

【図8】打合スペースにおける会話の有無に応じた音圧レベルの周波数特性を示す図である。

【図9】打合スペースにおける会話の有無に応じたＬ_diffの度数分布を示す図である。

【図10】閾値Ｌ_Tの設定値と判定精度の関係を示す図である。

【発明を実施するための形態】

【0013】

以下、本発明の実施の形態を図面を参照しつつ説明する。図１は本発明の実施形態に係る会話認識記録システム１のオフィス１００への適用例を示す図である。また、図２は本発明の実施形態に係る会話認識記録システム１のブロック図を示す図である。

【0014】

本実施形態に係る会話認識記録システム１が適用されるオフィス１００における床１０１及び天井１０２の間の空間は、床１０１及び天井１０２の点線で示される区画によって、仮想的に分割されていることを想定している。本実施形態では、４×４の計１６の区画によって分割されている例を示すが、本発明において、区画の分割例がこれに限られるものではない。本実施形態においてはそれぞれ区画を、図示するように、第１区画、第２区画、第３区画、・・・・、第１５区画、第１６区画と称することとする。

【0015】

それぞれの区画の天井１０２においては、当該区画における音を集音するマイクロホン３０'、３０' '、３０' ' ' ・・・が設けられている。マイクロホン３０'、３０' '、３０' ' ' ・・・で集音された音データについては、情報処理装置２０に対して有線又は無線によるデータ通信によって送信される。

【0016】

例えば、情報処理装置２０としては、ＣＰＵなどの演算を実行する演算部、表示や入力を行うインターフェイス部、有線又は無線によるデータ通信を行う通信部、データ記録を行うＨＤＤ、ＳＳＤなどの記憶部等、を有するパーソナルコンピューターなどの汎用のものを用いることができる。なお、情報処理装置２０としては、パーソナルコンピューターに限らず、タブレット型端末などの他のものを用いるようにしてもよい。

【0017】

このような情報処理装置２０には、各マイクロホン３０'、３０' '、３０' ' ' ・・・で集音された音データが入力され、情報処理装置２０ではそれぞれの音データの解析が行われ、当該音データに音声が含まれているか否かが判定される。

【0018】

また、オフィス１００の壁面には、オフィス１００内の空間を全的的に撮像することが可能なカメラ６０が取り付けられている。カメラ６０で撮像された画像データは、情報処理装置２０に対して有線又は無線によるデータ通信によって送信される。情報処理装置２０では、カメラ６０から送信された画像データの画像解析が行われ、人が存在するか否かが判定される。

【0019】

以上のように構成される本発明に係る会話認識記録システム１がオフィス１００内における会話を認識し、会話の発生等を記録する処理について図３を参照して説明する。図３は本発明の実施形態に係る会話認識記録システム１の設定時間間隔毎の処理アルゴリズムのフローチャートを示す図である。

【0020】

また、図３に示すフローチャートは、予め設定された時間間隔幅（タイムスロット）１つに対する処理を示すものであり、設定時間より長い時間にわたって会話認識・会話発生記録を行う場合、図３に示すフローチャートが複数回繰り返して実行されることとなる。

【0021】

図３において、ステップＳ１００で、会話認識・会話発生記録の処理が開始されると、続くステップＳ１０１では、音声判定のサブルーチンが実行される。ここで、図４を参照して音声判定のサブルーチンを説明する。

【0022】

図４に示すフローチャートにおいて、ステップＳ２００で処理が開始されると、続いてステップＳ２０１に進み、第Ｎ区画として、第１区画がセットされる。ここで、Ｎは１ずつインクリメントされる変数である。

【0023】

続いて、ステップＳ２０２に進み、マイクロホン３０によって取得された音データのうち、第Ｎ区画における設定時間間隔幅の音データを取得する。

【0024】

ステップＳ２０３では、取得された集音データに対して設定された時間間隔幅の中心周波数５００Ｈｚのオクターブバンド等価音圧レベル（Ｌ_500eq）を算出する。

【0025】

ここで、本明細書においては、予め設定された時間間隔幅（タイムスロット）における中心周波数５００Ｈｚのオクターブバンド等価音圧レベルをＬ_500eqといい、Ａ特性等価音圧レベルをＬ_Aeqという。

【0026】

次のステップＳ２０４では、音データに対して、Ａ特性重み付け補正を実行する。このようなＡ特性重み付け補正については、周知の方法によって実行され得るものである。

【0027】

ステップＳ２０５では、ステップＳ２０３でＡ特性重み付け補正された集音データに対して設定時間間隔幅のＡ特性等価音圧レベル（Ｌ_Aeq）を算出する。

【0028】

続いて、情報処理装置２０がＡ特性等価音圧レベル（Ｌ_Aeq）と中心周波数５００Ｈｚのオクターブバンド等価音圧レベル（Ｌ_500eq）を受信すると、ステップＳ２０６では、
Ｌ_diff＝Ｌ_500eq－Ｌ_Aeq （１）
の演算が実行され、ステップＳ２０６では、
Ｌ_diff≧ Ｌ_T （２）
の真否が判定される。

【0029】

ステップＳ２０７の判定結果がＹＥＳであるときには、ステップＳ２０８に進み、当該時間間隔幅における検知結果は「音声検知」とし、ステップＳ２１０で第Ｎ区画では「音声検知」の結果を履歴として記録する。

【0030】

一方、ステップＳ２０７の判定結果がＮＯであるときには、ステップＳ２０９に進み、当該時間間隔幅における検知結果は「音声非検知」とし、ステップＳ２１０で第Ｎ区画では「音声非検知」の結果を履歴として記録する。

【0031】

ステップＳ２１１では、全区画が終了したか否か（本例では、Ｎ＝１６であるか否か）が判定される。ステップＳ２１１の判定結果がＮＯであれば、ステップＳ２１２に進み、Ｎを「１」インクリメントして、次の区画に進み、ステップＳ２０２に進む。一方、ステップＳ２１１の判定結果がＹＥＳであれば、ステップＳ２１３に進み、元のメインルーチンにリターンする。

【0032】

元のメインルーチンでは、続いて、ステップＳ１０２に進み、人判定サブルーチンが実行される。ここで、図５を参照して人判定サブルーチンを説明する。

【0033】

図５に示すフローチャートにおいて、ステップＳ３００において、人判定サブルーチンが開始されると、ステップＳ３０１に進み、予め設定された時間間隔幅（タイムスロット）におけるカメラ６０による撮像データを取得し、ステップＳ３０２で、取得された撮像データの画像解析を実行する。

【0034】

ステップＳ３０３では、第Ｎ区画として、第１区画がセットされる。ここで、Ｎは１ずつインクリメントされる変数である。

【0035】

次のステップＳ３０４では、撮像データの画像解析結果に基づいて、着目する第Ｎ区画とその回りの区画で複数人の画像を認識したか否かを判定する。ここで、図６には、着目区画とその周辺の区画とが図示されている。図６において、アンダーバーが付された数字が、区画の序数を示している。例えば、図６に示すように、着目する区画が第６区画であるものとすると、その周辺の区画とは、点線が通過する第１区画、第２区画、第３区画、第５区画、第７区画、第９区画、第１０区画、第１１区画が該当する。

【0036】

ステップＳ３０４の判定結果がＹＥＳであるときには、ステップＳ３０５に進み、当該時間間隔幅における検知結果は「複数人検知」とし、ステップＳ３０７で第Ｎ区画では「複数人検知」の結果を履歴として記録する。

【0037】

一方、ステップＳ３０４の判定結果がＮＯであるときには、ステップＳ３０６に進み、当該時間間隔幅における検知結果は「複数人非検知」とし、ステップＳ３０７で第Ｎ区画では「複数人非検知」の結果を履歴として記録する。

【0038】

ステップＳ３０８では、全区画が終了したか否か（本例では、Ｎ＝１６であるか否か）が判定される。ステップＳ３０８の判定結果がＮＯであれば、ステップＳ３０９に進み、Ｎを「１」インクリメントして、次の区画に進み、ステップＳ３０４に進む。一方、ステップＳ３０８の判定結果がＹＥＳであれば、ステップＳ３１０に進み、元のメインルーチンにリターンする。

【0039】

なお、本実施形態では、人判定に係る技術には、カメラによって撮像された画像データを画像解析することによって行う構成が採用されているが、人判定においてはその他の技術を用いることもできる。例えば、人判定に係る技術には、ＲＦＩＤタグを利用することで、ある区画周辺で複数の人が存在するか否かを判定するようにしてもよいし、また、人感センサーを利用することで、ある区画周辺で複数の人が存在するか否かを判定するようにしてもよい。さらに、人判定に係る技術には、赤外線センサー、振動センサー、ＣＯ₂センサーなどを応用するようにしてもよい。

【0040】

さて、図３のメインルーチンに戻り、続いて、ステップＳ１０３では、第Ｎ区画として、第１区画がセットされる。ここで、Ｎは１ずつインクリメントされる変数である。

【0041】

ステップＳ１０４においては、音声判定サブルーチンの結果により、第Ｎ区画で「音声検知」であったか否かが判定される。判定結果がＮＯであれば、ステップＳ１０７に進み、第Ｎ区画＝（会話非発生）として記録が残される。判定結果がＹＥＳであれば、続いて、ステップＳ１０５に進む。

【0042】

ステップＳ１０５においては、人判定サブルーチンの結果により、第Ｎ区画で「複数人検知」であったか否かが判定される。判定結果がＮＯであれば、ステップＳ１０７に進み、第Ｎ区画＝（会話非発生）として記録が残される。判定結果がＹＥＳであれば、続いて、ステップＳ１０６に進み、第Ｎ区画＝（会話発生）として記録が残される。

【0043】

ステップＳ１０８では、全区画が終了したか否か（本例では、Ｎ＝１６であるか否か）が判定される。ステップＳ１０８の判定結果がＮＯであれば、ステップＳ１０９に進み、Ｎを「１」インクリメントして、次の区画に進み、ステップＳ１０４に進む。一方、ステップＳ１０８の判定結果がＹＥＳであれば、ステップＳ１１０に進み、処理を終了する。

【0044】

以上のような本発明に係る会話認識記録システム１で記録される履歴について説明する。図７は本発明の実施形態に係る会話認識記録システム１による記録例を示す図である。図７に示す例では、設定された時間間隔幅（タイムスロット）が３０秒間であり、当該時間間隔幅においてそれぞれの区画で、会話が発生したのか（「会話発生」記録）、或いは、会話が発生しなかったのか（「会話非発生」記録）についての履歴が残される。例えば、１０：３０：００～１０：３０：３０での時間間隔区幅では、第１区画＝（会話発生）、第２区画＝（会話発生）、第３区画＝（会話発生）、第４区画＝（会話非発生）、・・・・第１６区画＝（会話非発生）のような履歴が取得される。

【0045】

上記のような本発明に係る会話認識記録システム１では、図１の（Ａ）周辺において会議を行っているスペースにおいては、（会話発生）の履歴が取得されるが、一方で、図１の（Ｂ）において１人が電話対応のみを行っているようなケースでは、（会話非発生）のような履歴が取得される。このように本発明に係る会話認識記録システム１では、空間内における実際の会話を高い確度で認識し履歴を残すことが可能となる。

【0046】

以上のような、本発明に係る会話認識記録システム１では、音声判定において、ある区画で集音された音に音声が含まれると判定され、かつ、人判定において、当該区画周辺で複数の人が存在すると判定されると当該区画で会話が発生したものと認識するものであり、このような本発明に係る会話認識記録システム１によれば、所定の空間内にける会話の有無を高い精度で認識し、記録を行うことが可能となる。

【0047】

次に上記のような本発明に係る会話認識記録システム１における音声検知の判定方法（音声判定のサブルーチン）の技術的根拠を示す。

【0048】

図８に、オフィス内の打合スペースにおいて会話が行われていた場合と会話が行われていない場合の音圧レベルの周波数特性を示す。図８の周波数特性の測定は１分間オクターブバンド等価音圧レベルを連続測定した。全測定サンプルは５６２２サンプル、その内会話が行われていた場合は１４０６サンプル、会話が行われていない場合は４２１６サンプルであった。図８には、打合スペースで会話が行われていた場合と会話が行われていない場合それぞれにおける測定結果の平均値と平均値±標準偏差を示す。なお、各周波数における音圧レベルはＡ特性により重み付けされた値である。

【0049】

図８からは、等価音圧レベルを測定した１分間に会話が行われている場合、即ち音声が含まれている場合は５００Ｈｚオクターブバンド音圧レベルが卓越した周波数特性であることがわかる。一方、会話が行われていない場合、即ち音声が含まれていない場合はこのような特徴は示されていない。以上の測定結果は、音声は５００Ｈｚオクターブバンドに主な周波数成分を持つことを示している。

【0050】

逆に言えば、測定した音の周波数特性において５００Ｈｚオクターブバンド音圧レベルが卓越している場合、その測定した音には音声が含まれている可能性が高いことを示唆する。

【0051】

ここで、Ａ特性音圧レベルと５００Ｈｚオクターブバンド音圧レベルの関係を考える。仮に、測定した音が５００Ｈｚオクターブバンドにのみ周波数成分を持つとすると、Ａ特性音圧レベルの定義からその差Ｌ_diffは３．２ｄＢとなる。

【0052】

実際には、音声は５００Ｈｚオクターブバンド以外の帯域にも周波数成分を持つため、Ａ特性音圧レベルとＬ_diffがちょうど３．２ｄＢとなることはないが、Ｌ_diffが３．２ｄＢに近いほど測定した音の５００Ｈｚオクターブバンド音圧レベルが卓越していることを意味する。

【0053】

図８に示した測定結果からＬ_diffを算出し、打合スペースにおいて会話が行われていた場合と会話が行われていない場合それぞれにおけるＬ_diffの度数分布を図９に示す。

【0054】

図９から、会話が行われている場合は、会話が行われていない場合と比較してＬ_diffが大きい、即ちＬ_diffが３．２ｄＢに近いことが示されている。

【0055】

Ｌ_diffから測定した音に音声が含まれていると判定する閾値Ｌ_Tの設定値により、判定精度が変化する。図１０に、閾値Ｌ_Tの設定値と判定精度の関係を示す。

【0056】

ここで示した測定例では、閾値Ｌ_Tを－１ｄＢに設定した場合に、会話が行われていること及び会話が行われていないことの判定精度が共に９０％程度であった。

【0057】

閾値Ｌ_Tを大きい値に設定すると、測定した音に音声が含まれているにも関わらず音声が含まれていないと誤判定する確率が高くなる。一方で、閾値Ｌ_Tを小さい値に設定すると、測定した音に音声が含まれていないにも関わらず音声が含まれていると誤判定する確率が高くなる。閾値Ｌ_Tは音声以外の周囲の騒音等の影響を加味して設定する必要がある。

【0058】

ここで示した測定例では、１分間の等価音圧レベルを測定しているが、等価音圧レベルの測定時間は１分間に限定されるものではない。等価音圧レベルの測定時間は必要な音声検出頻度により設定するが、一般的には１０秒間から１０分間程度と設定することが適当である。なお、等価音圧レベルの測定時間を長く設定した場合、測定時間内の短い時間にのみ音声が含まれる場合は音声が含まれないものと判定されることがある。

【0059】

上記のような、技術的な根拠により、本発明に係る会話認識記録システムは音声検出の判定を行うものであり、原理的にみても、複雑なデータ処理等が不要なことが明白である。

【0060】

このように、本発明に係る会話認識記録システム１における音声判定は、集音された音に基づいて、設定された時間間隔帯におけるＡ特性等価音圧レベル（Ｌ_Aeq）と、中心周波数５００Ｈｚのオクターブバンド等価音圧レベル（Ｌ_500eq）とを算出し、中心周波数５００Ｈｚのオクターブバンド等価音圧レベル（Ｌ_500eq）からＡ特性等価音圧レベル（Ｌ_Aeq）を引いた差分が予め設定された閾値以上である場合、集音された音に音声が含まれていると判定するものであり、このような本発明に係る会話認識記録システム１の音声判定によれば、音圧レベルの値や変動幅を用いることなく、高い精度で音声の有無を検知することが可能となる。

【0061】

また、本発明に係る会話認識記録システム１における音声判定は、高度な信号処理技術や人工知能等を用い、音声が含まれているかを判定することではなく、安価で簡便な装置構成で検知を行うものであり、広い空間内や建物内各所の多点で簡便に音声を検知することが可能となる。

【0062】

以上、本発明に係る会話認識記録システムは、音声判定部において、ある区画で集音された音に音声が含まれると判定され、かつ、人判定部において、当該区画周辺で複数の人が存在すると判定されると当該区画で会話が発生したものと認識するものであり、このような本発明に係る会話認識記録システムによれば、所定の空間内にける会話の有無を高い精度で認識し、記録を行うことが可能となる。

【0063】

また、本発明に係る会話認識記録システムによれば、会話量および発生位置をモニタリングすることができ、それにより、建物内でのコミュニケーションの発生頻度や打合せスペースの利活用状況などを把握することができる。

【0064】

また、本発明に係る会話認識記録システムによれば、取得した履歴データはオフィスのレイアウト変更などの知的生産性を向上させるための空間設計に活用することができる。

【符号の説明】

【0065】

１・・・会話認識記録システム
２０・・・情報処理装置
３０・・・マイクロホン
６０・・・カメラ
１００・・・オフィス
１０１・・・床
１０２・・・天井

【図1】