特許7153841 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 株式会社ナカヨの特許一覧

特許7153841インターカムシステム、インターカム端末、およびインターカム通話方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-10-06

(45)【発行日】2022-10-17

(54)【発明の名称】インターカムシステム、インターカム端末、およびインターカム通話方法

(51)【国際特許分類】

H04M 3/56 20060101AFI20221007BHJP

H04M 1/72 20210101ALI20221007BHJP

H04M 11/06 20060101ALI20221007BHJP

【ＦＩ】

H04M3/56 Z

H04M1/72

H04M11/06

【請求項の数】 4

(21)【出願番号】P 2019024897

(22)【出願日】2019-02-14

(65)【公開番号】P2020136784

(43)【公開日】2020-08-31

【審査請求日】2021-07-12

(73)【特許権者】

【識別番号】000134707

【氏名又は名称】株式会社ナカヨ

(74)【代理人】

【識別番号】100104570

【弁理士】

【氏名又は名称】大関光弘

(72)【発明者】

【氏名】金川修

【審査官】山岸登

(56)【参考文献】

【文献】特表２０１６－５２４８４２（ＪＰ，Ａ）

【文献】特開２００１－１４２４８７（ＪＰ，Ａ）

【文献】特開２００３－０４６６０７（ＪＰ，Ａ）

【文献】特開２０１８－０６７９２０（ＪＰ，Ａ）

【文献】国際公開第２０１６／０８４４５９（ＷＯ，Ａ１）

【文献】特開２０１３－０１２７９３（ＪＰ，Ａ）

【文献】特開２００５－１８４８５２（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｂ７／２４－７／２６

Ｈ０４Ｍ１／００

１／２４－３／００

３／１６－３／２０

３／３８－３／５８

７／００－７／１６

１１／００－１１／１０

９９／００

Ｈ０４Ｗ４／００－９９／００

(57)【特許請求の範囲】

【請求項1】

複数のインターカム端末と、インターカムサーバと、を備えたインターカムシステムであって、
前記インターカム端末は、
操作者の指示に従い送話モードと受話モードとを切り替えるモード切替手段と、
前記送話モードの場合に、前記操作者の入力音声に音声認識処理を施すことにより得られるテキストデータを前記インターカムサーバに送信する送信手段と、
前記受話モードの場合に、前記インターカムサーバより受信したテキストデータを受信順に音声変換して出力する音声合成手段と、を有し、
前記インターカムサーバは、
受信したテキストデータを、当該テキストデータの送信元である前記インターカム端末以外のすべての前記インターカム端末に一斉送信する
ことを特徴とするインターカムシステム。

【請求項2】

複数でインターカムシステムを構成するインターカム端末であって、
操作者の指示に従い送話モードと受話モードとを切り替えるモード切替手段と、
前記送話モードの場合に、前記操作者の入力音声に音声認識処理を施すことにより得られるテキストデータを、前記インターカムシステムを構成する自インターカム端末以外のすべての前記インターカム端末に一斉送信する一斉送信手段と、
前記受話モードの場合に、他の前記インターカム端末より受信したテキストデータを受信順に音声変換して出力する音声合成手段と、を有する
ことを特徴とするインターカム端末。

【請求項3】

インターカムサーバを介して複数のインターカム端末間でインターカムによる通話を行うインターカム通話方法であって、
前記インターカム端末は、
操作者の指示に従い送話モードと受話モードとを切り換え、
前記送話モードの場合に、前記操作者の入力音声に音声認識処理を施すことにより得られるテキストデータを前記インターカムサーバに送信し、
前記受話モードの場合に、前記インターカムサーバより受信したテキストデータを受信順に音声変換して出力し、
前記インターカムサーバは、
受信したテキストデータを、当該テキストデータの送信元である前記インターカム端末以外のすべての前記インターカム端末に一斉送信する
ことを特徴とするインターカム通話方法。

【請求項4】

複数のインターカム端末間でインターカムによる通話を行うインターカム通話方法であって、
前記インターカム端末は、
操作者の指示に従い送話モードと受話モードとを切り換え、
前記送話モードの場合に、前記操作者の入力音声に音声認識処理を施すことにより得られるテキストデータを、前記インターカムシステムを構成する自インターカム端末以外のすべての前記インターカム端末に一斉送信し、
前記受話モードの場合に、他の前記インターカム端末より受信したテキストデータを受信順に音声変換して出力する
ことを特徴とするインターカム通話方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、インターカムシステムに関する。

【背景技術】

【0002】

特許文献１には、ＶｏＩＰ（ＶｏｉｃｅｏｖｅｒＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ）を用いて電話会議を実現する電話会議装置が開示されている。この電話会議装置は、電話会議に参加する複数の電話端末から送られてきた音声データをミキシングして混合音声データを生成し、生成した混合音声データを、電話会議に参加するすべての電話端末に送信する。この際、音声データを送信した複数の電話端末各々に対しては、この電話端末が送信した音声データを除いてミキシングした混合音声データを送信する。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２００４－３６４０３４号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

特許文献１に記載の電話会議装置の技術は、インターカムシステムにおいて、送話側のインターカム端末の音声データを複数の受話側のインターカム端末に一斉送信するインターカムサーバに利用することができる。しかしながら、複数の音声データがミキシングされると、複数の発話者の発言が重なって、誰がどの発言をしたのかを判別し難い。この場合、双方向通信を前提とした電話会議端末では、気軽に聞き直すことができるが、ＰＴＴ（ＰｕｓｈＴｏＴａｌｋ）ボタンで受話と送話とを切り替えるインターカム端末では、受話と送話とを同時に行うことができないため、聞き漏らしがあった場合に気軽に聞き直すことができず、コミュニケーションを阻害する。

【0005】

本発明は上記事情に鑑みてなされたものであり、本発明の目的は、インターカムシステムにおいて、多人数による良好なコミュニケーションを実現することにある。

【課題を解決するための手段】

【0006】

上記課題を解決するために、本発明のインターカムシステムにおいて、送話側のインターカム端末は、送話毎に変換された入力音声のテキストデータをインターカムサーバに送信する。これを受けて、インターカムサーバは、受信したテキストデータをこのテキストデータの送信元以外のインターカム端末に一斉送信する。そして、受話側のインターカム端末は、受信したテキストデータを順番に音声変換して出力する。

【0007】

例えば、本発明のインターカムシステムは、
複数のインターカム端末と、インターカムサーバと、を備えたインターカムシステムであって、
前記インターカム端末は、
操作者の指示に従い送話モードと受話モードとを切り替えるモード切替手段と、
前記送話モードの場合に、前記操作者の入力音声に音声認識処理を施すことにより得られるテキストデータを前記インターカムサーバに送信する送信手段と、
前記受話モードの場合に、前記インターカムサーバより受信したテキストデータを受信順に音声変換して出力する音声合成手段と、を有し、
前記インターカムサーバは、
受信したテキストデータを当該テキストデータの送信元である前記インターカム端末以外のすべての前記インターカム端末に一斉送信する。

【0014】

また、本発明のインターカム端末において、送話側のインターカム端末は、送話毎に変換された入力音声のテキストデータを、自インターカム端末以外のインターカム端末に一斉送信する。そして、受話側のインターカム端末は、受信したテキストデータを順番に音声変換して出力する。

【0015】

例えば、本発明のインターカム端末は、
複数でインターカムシステムを構成するインターカム端末であって、
操作者の指示に従い送話モードと受話モードとを切り替えるモード切替手段と、
前記送話モードの場合に、前記操作者の入力音声に音声認識処理を施すことにより得られるテキストデータを、前記インターカムシステムを構成する自インターカム端末以外のすべての前記インターカム端末に一斉送信する一斉送信手段と、
前記受話モードの場合に、他の前記インターカム端末より受信したテキストデータを受信順に音声変換して出力する音声合成手段と、を有する。

【発明の効果】

【0018】

本発明において、送話側のインターカム端末に入力された音声は、送話単位でテキストデータに変換され、受話側のインターカム端末に伝送される。そして、受話側のインターカム端末において、受信されたテキストデータは、順番に音声変換されて出力される。このため、複数の発話者の発言が重なった場合でも、これらの発言が個別に受話側に伝わって順番に出力されるので、受話側において誰がどの発言をしたのかを判別し易い。したがって、本発明によれば、インターカムシステムにおいて、多人数による良好なコミュニケーションを実現することができる。

【図面の簡単な説明】

【0019】

【図1】図１は、本発明の第１実施の形態に係るインターカムシステムの概略構成図である。

【図2】図２は、本発明の第１実施の形態に係るインターカムシステムの動作例を説明するためのシーケンス図である。

【図3】図３は、インターカムサーバ１の概略機能構成図である。

【図4】図４は、インターカムサーバ１の動作を説明するためのフロー図である。

【図5】図５は、インターカム端末２の概略機能構成図である。

【図6】図６は、インターカム端末２の動作を説明するためのフロー図である。

【図7】図７は、本発明の第２実施の形態に係るインターカムシステムの動作例を説明するためのシーケンス図である。

【図8】図８は、インターカム端末２Ａの概略機能構成図である。

【図9】図９は、インターカム端末２Ａの動作を説明するためのフロー図である。

【図10】図１０は、本発明の第３実施の形態に係るインターカムシステムの概略構成図である。

【図11】図１１は、本発明の第３実施の形態に係るインターカムシステムの動作例を説明するためのシーケンス図である。

【図12】図１２は、インターカム端末２Ｂの概略機能構成図である。

【図13】図１３は、本発明の第４実施の形態に係るインターカムシステムの動作例を説明するためのシーケンス図である。

【図14】図１４は、インターカム端末２Ｃの概略機能構成図である。

【発明を実施するための形態】

【0020】

以下に、本発明の実施の形態について図面を参照して説明する。

【0021】

［第１実施の形態］
図１は、本発明の第１実施の形態に係るインターカムシステムの概略構成図である。

【0022】

図示するように、本実施の形態に係るインターカムシステムは、ＷＡＮ、ＬＡＮ等のネットワーク３に接続されたインターカムサーバ１と、無線アクセスポイント（無線ＡＰ）４を介してネットワーク３に接続された複数台のインターカム端末２－１～２－３（以下、単にインターカム端末２とも呼ぶ）と、を備えて構成される。

【0023】

インターカムサーバ１は、インターカム端末２より受信したテキストデータを、このテキストデータの送信元であるインターカム端末２以外のすべてのインターカム端末２に一斉送信する。インターカム端末２は、ＰＴＴ（ＰｕｓｈＴｏＴａｌｋ）ボタンのオン・オフで送話モードと受話モードとを切り替えることができる。そして、送話モードの場合、操作者の入力音声に音声認識処理を実施することにより得られるテキストデータをインターカムサーバ１に送信する。また、受話モードの場合、インターカムサーバ１より受信したテキストデータを受信順に音声変換して出力する。

【0024】

図２は、本発明の第１実施の形態に係るインターカムシステムの動作例を説明するためのシーケンス図である。

【0025】

インターカム端末２－１～２－３の動作モードは、デフォルトで受話モード（ＰＴＴボタンがオフ）に設定されているものとする（Ｓ１００）。

【0026】

まず、インターカム端末２－１の操作者（以下、操作者Ａとする）により、インターカム端末２－１のＰＴＴボタンがオンにされたものとする（Ｓ１０１）。これを受けて、インターカム端末２－１は、自身の動作モードを送話モードに切り替える（Ｓ１０２）。そして、操作者Ａの発話により入力された音声に対する音声認識処理を開始して、操作者Ａの発話内容をテキストデータに変換する（Ｓ１０３）。

【0027】

その後、操作者Ａにより、インターカム端末２－１のＰＴＴボタンがオフにされると（Ｓ１０４）、インターカム端末２－１は、自身の動作モードを送話モードから受話モードに切り替える（Ｓ１０５）。そして、音声認識処理を終了し（Ｓ１０６）、それまでに変換された操作者Ａの発話内容のテキストデータを表示するとともに（Ｓ１０７）、このテキストデータをインターカムサーバ１に送信する（Ｓ１０８）。

【0028】

ここで、インターカム端末２－１の動作モードが送話モードの間に（Ｓ１０２～Ｓ１０５）、インターカム端末２－２の操作者（以下、操作者Ｂとする）によりインターカム端末２－２のＰＴＴボタンがオンにされたものとする（Ｓ１０９）。これを受けて、インターカム端末２－２は、自身の動作モードを送話モードに切り替える（Ｓ１１０）。そして、操作者Ｂの発話により入力された音声に対する音声認識処理を開始して、操作者Ｂの発話内容をテキストデータに変換する（Ｓ１１１）。

【0029】

その後、操作者Ｂによりインターカム端末２－２のＰＴＴボタンがオフにされると（Ｓ１１２）、インターカム端末２－２は、自身の動作モードを送話モードから受話モードに切り替える（Ｓ１１３）。そして、音声認識処理を終了し（Ｓ１１４）、それまでに変換された操作者Ｂの発話内容のテキストデータを表示するとともに（Ｓ１１５）、このテキストデータをインターカムサーバ１に送信する（Ｓ１１６）。

【0030】

インターカムサーバ１は、インターカム端末２－１より操作者Ａの発話内容のテキストデータを受信すると、インターカム端末２－１以外のすべてのインターカム端末２－２、２－３に、このテキストデータを一斉送信する（Ｓ１１７）。同様に、インターカム端末２－２より操作者Ｂの発話内容のテキストデータを受信すると、インターカム端末２－２以外のすべてのインターカム端末２－１、２－３に、このテキストデータを一斉送信する（Ｓ１１８）。

【0031】

インターカム端末２－３は、動作モードが受話モードであるため、インターカムサーバ１より操作者Ａの発話内容のテキストデータおよび操作者Ｂの発話内容のテキストデータを順番に受信すると、操作者Ａの発話内容のテキストデータおよび操作者Ｂの発話内容のテキストデータをその受信順に表示する（Ｓ１１９）。また、操作者Ａの発話内容のテキストデータおよび操作者Ｂの発話内容のテキストデータをその受信順に音声変換して音声出力（音声読上げ）する（Ｓ１２０）。なお、インターカム端末２－３の動作モードが送話モードである場合、テキストデータの表示（Ｓ１１９）のみを行い、テキストデータの音声読上げ（Ｓ１２０）は行わない。

【0032】

また、インターカム端末２－１は、動作モードが送話モードから受話モードに切り替わっているため、インターカムサーバ１より操作者Ｂの発話内容のテキストデータを受信すると、この操作者Ｂの発話内容のテキストデータを表示する（Ｓ１２１）。また、操作者Ｂの発話内容のテキストデータを音声変換して音声出力（音声読上げ）する（Ｓ１２２）。なお、インターカム端末２－１の動作モードが送話モードである場合、テキストデータの表示（Ｓ１２１）のみを行い、テキストデータの音声読上げ（Ｓ１２２）は行わない。

【0033】

同様に、インターカム端末２－２は、動作モードが送話モードから受話モードに切り替わっているため、インターカムサーバ１より操作者Ａの発話内容のテキストデータを受信すると、この操作者Ａの発話内容のテキストデータを表示する（Ｓ１２３）。また、操作者Ａの発話内容のテキストデータを音声変換して音声出力（音声読上げ）する（Ｓ１２４）。なお、インターカム端末２－２の動作モードが送話モードである場合、テキストデータの表示（Ｓ１２３）のみを行い、テキストデータの音声読上げ（Ｓ１２４）は行わない。

【0034】

つぎに、本実施の形態に係るインターカムシステムを構成するインターカムサーバ１およびインターカム端末２の詳細を説明する。

【0035】

まず、インターカムサーバ１の詳細を説明する。

【0036】

図３は、インターカムサーバ１の概略機能構成図である。

【0037】

図示するように、インターカムサーバ１は、ネットワークインターフェース部１０と、端末情報記憶部１１と、中継処理部１２と、を備えている。

【0038】

ネットワークインターフェース部１０は、ネットワーク３に接続するためのインターフェースである。

【0039】

端末情報記憶部１１には、すべてのインターカム端末２のアドレス情報を含む端末情報が記憶されている。

【0040】

中継処理部１２は、インターカムによるインターカム端末２間の通話を中継する。

【0041】

図４は、インターカムサーバ１の動作を説明するためのフロー図である。

【0042】

中継処理部１２は、ネットワークインターフェース部１０を介してインターカム端末２からテキストデータを受信すると（Ｓ２３０でＹＥＳ）、端末情報記憶部１１を参照し、テキストデータの送信元のインターカム端末２を除くすべてのインターカム端末２に、このテキストデータを一斉送信する（Ｓ２３１）。

【0043】

つぎに、インターカム端末２の詳細を説明する。

【0044】

図５は、インターカム端末２の概略機能構成図である。

【0045】

図示するように、インターカム端末２は、無線インターフェース部２０と、マンマシンインターフェース部２１と、モード切替部２２と、音声認識部２３と、送信部２４と、受信部２５と、音声合成部２６と、テキスト表示部２７と、を備えている。

【0046】

無線インターフェース部２０は、無線アクセスポイント４を介してネットワーク３に接続するためのインターフェースである。

【0047】

マンマシンインターフェース部２１は、ユーザがインターカムシステムを利用するためのインターフェースであり、ＰＴＴボタンを含む入力装置と、液晶ディスプレイ等の表示装置と、送受話器としてのマイクおよびスピーカと、を有している。

【0048】

モード切替部２２は、マンマシンインターフェース部２１のＰＴＴボタンのオン・オフにより、音声認識部２３および音声合成部２６の動作モードを送話モードおよび受話モードのいずれかに切り替える。具体的には、ＰＴＴボタンがオンのときに送話モードに切り替え、ＰＴＴボタンがオフのときに受話モードに切り替える。

【0049】

音声認識部２３は、モード切替部２２により切替え設定された動作モードが送話モードの場合に、マンマシンインターフェース部２１のマイクの入力音声に音声認識処理を実施して、操作者の発話内容をテキストデータに変換する。

【0050】

送信部２４は、音声認識部２３により変換されたテキストデータを、無線インターフェース部２０を介してインターカムサーバ１に送信する。

【0051】

受信部２５は、無線インターフェース部２０を介してインターカムサーバ１からテキストデータを受信する。

【0052】

音声合成部２６は、モード切替部２２により切替え設定された動作モードが受話モードの場合に、受信部２５により受信されたテキストデータを音声変換して、マンマシンインターフェース部２１のスピーカから音声出力（音声読上げ）する。

【0053】

テキスト表示部２７は、音声認識部２３により変換されたテキストデータおよび受信部２５により受信されたテキストデータを表示する。

【0054】

図６は、インターカム端末２の動作を説明するためのフロー図である。

【0055】

なお、インターカム端末２のマンマシンインターフェース部２１のＰＴＴボタンはデフォルトでオフ状態であり、これによりインターカム端末２の動作モードが受話モードに設定されているものとする。

【0056】

マンマシンインターフェース部２１のＰＴＴボタンがオフのまま（Ｓ３００でＮＯ）、つまり受話モードにおいて、受信部２５は、無線インターフェース部２０を介してインターカムサーバ１からテキストデータを受信すると（Ｓ３０１でＹＥＳ）、このテキストデータをテキスト表示部２７および音声合成部２６に渡す。これを受けて、テキスト表示部２７は、このテキストデータをマンマシンインターフェース部２１の表示装置に表示する（Ｓ３０２）。また、音声合成部２６は、動作モードが受話モードであるので、このテキストデータを音声変換してマンマシンインターフェース部２１のスピーカから音声出力（音声読上げ）する（Ｓ３０３）。

【0057】

一方、マンマシンインターフェース部２１のＰＴＴボタンがオンになると（Ｓ３００でＹＥＳ）、モード切替部２２は、動作モードを受話モードから送話モードに切り替える（Ｓ３０４）。これにより、音声認識部２３は、マンマシンインターフェース部２１のマイクの入力音声に対する音声認識処理を開始する（Ｓ３０５）。

【0058】

ここで、マンマシンインターフェース部２１のＰＴＴボタンがオンのまま（Ｓ３０６でＮＯ）、つまり送話モードにおいて、受信部２５は、無線インターフェース部２０を介してインターカムサーバ１からテキストデータを受信すると（Ｓ３０７でＹＥＳ）、このテキストデータをテキスト表示部２７および音声合成部２６に渡す。これを受けて、テキスト表示部２７は、このテキストデータをマンマシンインターフェース部２１の表示装置に表示する（Ｓ３０８）。しかし、音声合成部２６は、動作モードが送話モードであるので、このテキストデータの音声読上げを実施しない。

【0059】

一方、マンマシンインターフェース部２１のＰＴＴボタンがオフになると（Ｓ３０６でＹＥＳ）、モード切替部２２は、動作モードを送話モードから受話モードに切り替える（Ｓ３０９）。これにより、音声認識部２３は、マンマシンインターフェース部２１のマイクの入力音声に対する音声認識処理を終了し、それまでに変換された操作者の発話内容のテキストデータをテキスト表示部２７および送信部２４に渡す（Ｓ３１０）。これを受けて、テキスト表示部２７は、このテキストデータをマンマシンインターフェース部２１の表示装置に表示する（Ｓ３１１）。また、送信部２４は、無線インターフェース部２０を介してインターカムサーバ１に、このテキストデータを送信する（Ｓ３１２）。その後、Ｓ３００に戻る。

【0060】

以上、本発明の第１実施の形態について説明した。

【0061】

本実施の形態において、送話側のインターカム端末２に入力された音声は、送話単位でテキストデータに変換され、受話側のインターカム端末２に伝送される。そして、受話側のインターカム端末２において、受信されたテキストデータは、順番に音声変換されて出力（音声読上げ）される。このため、複数の発話者の発言が重なった場合でも、これらの発言が個別に受話側に伝わって順番に出力されるので、受話側において誰がどの発言をしたのかを判別し易い。したがって、本実施によれば、インターカムシステムにおいて、多人数による良好なコミュニケーションを実現することができる。

【0062】

また、本実施の形態において、インターカム端末２は、送話モード中にインターカムサーバ１からテキストデータを受信した場合、このテキストデータの音声読上げを実施せずに、このテキストデータの表示のみを実施する。このため、送話モード中においても、他の発話者の発言を確認することができ、インターカムシステムの使い勝手を向上させることができる。

【0063】

なお、本実施の形態では、インターカム端末２に音声認識部２３を搭載し、マンマシンインターフェース部２１に入力された音声に音声認識処理を実施して、操作者の発話内容をテキストデータに変換している。しかし、本発明はこれに限定されない。インターカム端末２が音声認識処理を外部の音声認識サーバに依頼してもよい。この場合、インターカム端末２は、動作モードが送話モードから受話モードに切り替わると、送話モード中にマンマシンインターフェース部２１に入力された音声データを音声認識サーバに送信して、この音声データに対する音声認識処理を音声認識サーバに依頼する。そして、音声認識サーバから操作者の発話内容のテキストデータを取得する。

【0064】

また、本実施の形態では、送話側のインターカム端末２において音声認識処理を実施して、操作者の発話内容をテキストデータに変換している。しかし、本発明はこれに限定されない。音声認識処理をインターカムサーバ１で実施してもよい。すなわち、インターカムサーバ１は、送話側のインターカム端末２から受信した音声データに音声認識処理を実施して、この音声データをテキストデータに変換し、このテキストデータを音声データ送信元のインターカム端末２以外のすべてのインターカム端末２に一斉送信する。ここで、インターカムサーバ１は、自身で音声認識処理を実施するのではなく、外部の音声認識サーバに音声認識処理を依頼してもよい。この場合、インターカムサーバ１は、送話側のインターカム端末２から受信した音声データを音声認識サーバに送信して、この音声データに対する音声認識処理を音声認識サーバに依頼する。そして、音声認識サーバからテキストデータを取得する。

【0065】

［第２実施の形態］
本発明の第２実施の形態に係るインターカムシステムが、図１に示す本発明の第１実施の形態に係るインターカムシステムと異なる点は、インターカムサーバ１に代えてインターカムサーバ１Ａを用いたこと、およびインターカム端末２－１～２－３に代えてインターカム端末２Ａ－１～２Ａ－３（以下、単にインターカム端末２Ａとも呼ぶ）を用いたことである。

【0066】

インターカムサーバ１Ａは、インターカム端末２Ａより受信した録音データおよびテキストデータを、これらのデータの送信元であるインターカム端末２Ａ以外のすべてのインターカム端末２Ａに一斉送信する。インターカム端末２Ａは、ＰＴＴボタンのオン・オフで送話モードと受話モードとを切り替えることができる。そして、動作モードが送話モードの場合、操作者の入力音声を録音することにより得られる録音データおよびこの入力音声に音声認識処理を施すことにより得られるテキストデータをインターカムサーバ１Ａに送信する。また、動作モードが受話モードの場合、インターカムサーバ１Ａより受信した録音データを受信順に再生して出力するとともに、録音データとともに受信したテキストデータを受信順に表示する。

【0067】

図７は、本発明の第２実施の形態に係るインターカムシステムの動作例を説明するためのシーケンス図である。

【0068】

インターカム端末２Ａ－１～２Ａ－３の動作モードは、デフォルトで受話モード（ＰＴＴボタンがオフ）に設定されているものとする（Ｓ１３０）。

【0069】

まず、インターカム端末２Ａ－１の操作者（以下、操作者Ｃとする）によりインターカム端末２Ａ－１のＰＴＴボタンがオンにされたものとする（Ｓ１３１）。これを受けて、インターカム端末２Ａ－１は、自身の動作モードを送話モードに切り替える（Ｓ１３２）。そして、操作者Ｃの発話により入力された音声の録音を開始するとともに、この入力音声に対する音声認識処理を開始して、操作者Ｃの発話内容をテキストデータに変換する（Ｓ１３３）。

【0070】

その後、操作者Ｃによりインターカム端末２Ａ－１のＰＴＴボタンがオフにされると（Ｓ１３４）、インターカム端末２Ａ－１は、自身の動作モードを受話モードに切り替える（Ｓ１３５）。そして、録音および音声認識処理を終了し（Ｓ１３６）、それまでに変換された操作者Ｃの発話内容のテキストデータを表示するとともに（Ｓ１３７）、それまでに録音された操作者Ｃの発話内容の録音データを、このテキストデータとともにインターカムサーバ１Ａに送信する（Ｓ１３８）。

【0071】

ここで、インターカム端末２Ａ－１の動作モードが送話モードの間に（Ｓ１３２～Ｓ１３５）、インターカム端末２Ａ－２の操作者（以下、操作者Ｄとする）によりインターカム端末２Ａ－２のＰＴＴボタンがオンにされたものとする（Ｓ１３９）。これを受けて、インターカム端末２Ａ－２は、自身の動作モードを送話モードに切り替える（Ｓ１４０）。そして、操作者Ｄの発話により入力された音声の録音を開始するとともに、この入力音声に対する音声認識処理を開始して、操作者Ｄの発話内容をテキストデータに変換する（Ｓ１４１）。

【0072】

その後、操作者Ｄによりインターカム端末２Ａ－２のＰＴＴボタンがオフにされると（Ｓ１４２）、インターカム端末２Ａ－２は、自身の動作モードを受話モードに切り替える（Ｓ１４３）。そして、録音および音声認識処理を終了し（Ｓ１４４）、それまでに変換された操作者Ｄの発話内容のテキストデータを表示するとともに（Ｓ１４５）、それまでに録音された操作者Ｄの発話内容の録音データを、このテキストデータとともにインターカムサーバ１Ａに送信する（Ｓ１４６）。

【0073】

インターカムサーバ１Ａは、インターカム端末２Ａ－１より操作者Ｃの発話内容の録音データおよびテキストデータを受信すると、この録音データおよびテキストデータを、インターカム端末２Ａ－１以外のすべてのインターカム端末２Ａ－２、２Ａ－３に一斉送信する（Ｓ１４７）。同様に、インターカム端末２Ａ－２より操作者Ｄの発話内容の録音データおよびテキストデータを受信すると、この録音データおよびテキストデータを、インターカム端末２Ａ－２以外のすべてのインターカム端末２Ａ－１、２Ａ－３に一斉送信する（Ｓ１４８）。

【0074】

インターカム端末２Ａ－３は、動作モードが受話モードであるため、インターカムサーバ１Ａより操作者Ｃの発話内容の録音データおよびテキストデータと、操作者Ｄの発話内容の録音データおよびテキストデータと、を順番に受信すると、操作者Ｃの発話内容のテキストデータおよび操作者Ｄの発話内容のテキストデータをその受信順に表示する（Ｓ１４９）。また、操作者Ｃの発話内容の録音データおよび操作者Ｄの発話内容の録音データをその受信順に再生して音声出力する（Ｓ１５０）。なお、インターカム端末２Ａ－３の動作モードが送話モードである場合、テキストデータの表示（Ｓ１４９）のみを行い、録音データの再生出力（Ｓ１５０）は行わない。

【0075】

また、インターカム端末２Ａ－１は、動作モードが送話モードから受話モードに切り替わっているため、インターカムサーバ１Ａより操作者Ｄの発話内容の録音データおよびテキストデータを受信すると、このテキストデータを表示する（Ｓ１５１）。また、操作者Ｄの発話内容の録音データを再生して音声出力する（Ｓ１５２）。なお、インターカム端末２Ａ－１の動作モードが送話モードである場合、テキストデータの表示（Ｓ１５１）のみを行い、録音データの再生出力（Ｓ１５２）は行わない。

【0076】

同様に、インターカム端末２Ａ－２は、動作モードが送話モードから受話モードに切り替わっているため、インターカムサーバ１Ａより操作者Ｃの発話内容の録音データおよびテキストデータを受信すると、この操作者Ｃの発話内容のテキストデータを表示する（Ｓ１５３）。また、操作者Ｃの発話内容の録音データを再生して音声出力する（Ｓ１５４）。なお、インターカム端末２Ａ－２の動作モードが送話モードである場合、テキストデータの表示（Ｓ１５３）のみを行い、録音データの再生出力（Ｓ１５４）は行わない。

【0077】

つぎに、本実施の形態に係るインターカムシステムを構成するインターカム端末２Ａの詳細を説明する。

【0078】

なお、本実施の形態に用いるインターカムサーバ１Ａは、テキストデータとともに録音データを中継する点を除き、図３に示す上記第１実施の形態に用いるインターカムサーバ１と同様であるので、その詳細な説明を省略する。

【0079】

図８は、インターカム端末２Ａの概略機能構成図である。

【0080】

図示するように、本実施の形態に用いるインターカム端末２Ａが図５に示す上記第１実施の形態に用いるインターカム端末２と異なる点は、音声合成部２６に代えて録音再生部２９を設けたこと、および録音部２８を追加したことである。その他の構成は、図５に示す上記第１実施の形態に用いるインターカム端末２と同様である。

【0081】

録音部２８は、モード切替部２２により切り替え設定された動作モードが送話モードの場合に、マンマシンインターフェース部２１のマイクに入力された操作者の発話を録音する。

【0082】

録音再生部２９は、モード切替部２２により切り替え設定された動作モードが受話モードの場合に、受信部２５により受信された録音データを再生して、マンマシンインターフェース部２１のスピーカから音声出力（録音再生）する。

【0083】

図９は、インターカム端末２Ａの動作を説明するためのフロー図である。

【0084】

なお、インターカム端末２Ａのマンマシンインターフェース部２１のＰＴＴボタンはデフォルトでオフ状態であり、これによりインターカム端末２Ａの動作モードは受話モードに設定されているものとする。

【0085】

マンマシンインターフェース部２１のＰＴＴボタンがオフのまま（Ｓ３２０でＮＯ）、つまり受話モードにおいて、受信部２５は、無線インターフェース部２０を介してインターカムサーバ１Ａから録音データをテキストデータとともに受信すると（Ｓ３２１でＹＥＳ）、録音データを録音再生部２９に渡すとともに、テキストデータをテキスト表示部２７に渡す。これを受けて、テキスト表示部２７は、このテキストデータをマンマシンインターフェース部２１の表示装置に表示する（Ｓ３２２）。また、録音再生部２９は、動作モードが受話モードであるので、この録音データを再生して、マンマシンインターフェース部２１のスピーカから音声出力（録音再生）する（Ｓ３２３）。

【0086】

一方、マンマシンインターフェース部２１のＰＴＴボタンがオンになると（Ｓ３２０でＹＥＳ）、モード切替部２２は、動作モードを受話モードから送話モードに切り替える（Ｓ３２４）。これにより、録音部２８は、マンマシンインターフェース部２１のマイクの入力音声の録音を開始するとともに、音声認識部２３は、この入力音声に対する音声認識処理を開始する（Ｓ３２５）。

【0087】

ここで、マンマシンインターフェース部２１のＰＴＴボタンがオンのまま（Ｓ３２６でＮＯ）、つまり送話モードにおいて、受信部２５は、無線インターフェース部２０を介してインターカムサーバ１から録音データをテキストデータとともに受信すると（Ｓ３２７でＹＥＳ）、録音データを録音再生部２９に渡すとともに、テキストデータをテキスト表示部２７に渡す。これを受けて、テキスト表示部２７は、このテキストデータをマンマシンインターフェース部２１の表示装置に表示する（Ｓ３２８）。しかし、録音再生部２９は、動作モードが送話モードであるので、この録音データの録音再生を実施しない。

【0088】

一方、マンマシンインターフェース部２１のＰＴＴボタンがオフになると（Ｓ３２６でＹＥＳ）、モード切替部２２は、動作モードを送話モードから受話モードに切り替える（Ｓ３２９）。これにより、録音部２８は、マンマシンインターフェース部２１のマイクの入力音声の録音を終了し、それまでに録音された操作者の発話内容の録音データを送信部２４に渡すとともに、音声認識部２３は、この入力音声に対する音声認識処理を終了し、それまでに変換された操作者の発話内容のテキストデータをテキスト表示部２７および送信部２４に渡す（Ｓ３３０）。これを受けて、テキスト表示部２７は、このテキストデータをマンマシンインターフェース部２１の表示装置に表示する（Ｓ３３１）。また、送信部２４は、この録音データを、このテキストデータとともに無線インターフェース部２０を介してインターカムサーバ１Ａに送信する（Ｓ３３２）。その後、Ｓ３２０に戻る。

【0089】

以上、本発明の第２実施の形態について説明した。

【0090】

本実施の形態によれば、上記第１実施の形態が有する効果に加えて、つぎの効果を有する。すなわち、受話側のインターカム端末２Ａにおいて、送話側のインターカム端末２Ａの操作者の発話内容の録音データが再生される。発話者によって声色が異なるため、送話側のインターカム端末２Ａの操作者は、それぞれの発話者の発話内容を再生音から聴覚により識別可能である。このため、上記第１実施の形態に比べて、発話者の認識がさらに容易になる。

【0091】

なお、本実施の形態においても、上記第１実施の形態に用いるインターカム端末２と同様に、インターカム端末２Ａに音声認識部２３を搭載する代わりに、インターカム端末２Ａが音声認識処理を外部の音声認識サーバに依頼してもよい。

【0092】

また、本実施の形態では、送話側のインターカム端末２Ａにおいて録音処理および音声認識処理を実施して、操作者の発話内容を録音するとともにテキストデータに変換している。しかし、本発明はこれに限定されない。録音処理および音声認識処理をインターカムサーバ１Ａで実施してもよい。すなわち、インターカムサーバ１Ａは、送話側のインターカム端末２Ａから受信した音声データを録音するとともに、この音声データに音声認識処理を実施して、この音声データをテキストデータに変換する。そして、録音データを、テキストデータとともに音声データ送信元のインターカム端末２Ａ以外のすべてのインターカム端末２Ａに一斉送信する。ここで、上記第１実施の形態に用いるインターカムサーバ１と同様に、インターカムサーバ１Ａは、自身で音声認識処理を実施するのではなく、外部の音声認識サーバに音声認識処理を依頼してもよい。

【0093】

また、本実施の形態では、送話側のインターカム端末２Ａからインターカムサーバ１Ａを介して受話側のインターカム端末２Ａにテキストデータを録音データとともに送信しているが、録音データのみを送信してテキストデータの送信を省略してもかまわない。この場合、送話側のインターカム端末２Ａにおける音声認識処理は不要である。また、この場合、受話側のインターカム端末２Ａにおいて、インターカムサーバ１Ａから受信した録音データに受信順に音声認識処理を実施してテキストデータに変換し、このテキストデータをマンマシンインターフェース部２１に表示することが好ましい。ここで、受話側のインターカム端末２Ａは、自身で音声認識処理を実施するのではなく、外部の音声認識サーバに音声認識処理を依頼してもよい。

【0094】

［第３実施の形態］
図１０は、本発明の第３実施の形態に係るインターカムシステムの概略構成図である。

【0095】

図示するように、本実施の形態に係るインターカムシステムは、無線アクセスポイント（無線ＡＰ）４を介してＷＡＮ、ＬＡＮ等のネットワーク３に接続された複数台のインターカム端末２Ｂ－１～２Ｂ－３（以下、単にインターカム端末２Ｂとも呼ぶ）を備えて構成される。

【0096】

インターカム端末２Ｂは、ＰＴＴボタンのオン・オフで送話モードと受話モードとを切り替えることができる。そして、動作モードが送話モードの場合、操作者の入力音声に音声認識処理を施すことにより得られるテキストデータを自インターカム端末２Ｂ以外のすべてのインターカム端末２Ｂに送信する。また、動作モードが受話モードの場合、他のインターカム端末２Ｂより受信したテキストデータを受信順に音声変換して出力する。

【0097】

図１１は、本発明の第３実施の形態に係るインターカムシステムの動作例を説明するためのシーケンス図である。

【0098】

インターカム端末２Ｂ－１～２Ｂ－３の動作モードは、デフォルトで受話モード（ＰＴＴボタンがオフ）に設定されているものとする（Ｓ１６０）。

【0099】

まず、インターカム端末２Ｂ－１の操作者（以下、操作者Ｅとする）によりインターカム端末２Ｂ－１のＰＴＴボタンがオンにされたものとする（Ｓ１６１）。これを受けて、インターカム端末２Ｂ－１は、動作モードを送話モードに切り替える（Ｓ１６２）。そして、操作者Ｅの発話により入力された音声に対する音声認識処理を開始して、操作者Ｅの発話内容をテキストデータに変換する（Ｓ１６３）。

【0100】

その後、操作者Ｅにより、インターカム端末２Ｂ－１のＰＴＴボタンがオフにされると（Ｓ１６４）、インターカム端末２Ｂ－１は、動作モードを送話モードから受話モードに切り替える（Ｓ１６５）。それから、音声認識処理を終了し（Ｓ１６６）、それまでに変換された操作者Ｅの発話内容のテキストデータを表示するとともに（Ｓ１６７）、このテキストデータを自インターカム端末２Ｂ－１以外のすべてのインターカム端末２Ｂ－２、２Ｂ－３に一斉送信する（Ｓ１６８）。

【0101】

ここで、インターカム端末２Ｂ－１の動作モードが送話モードの間に（Ｓ１６２～Ｓ１６５）、インターカム端末２Ｂ－２の操作者（以下、操作者Ｆとする）によりインターカム端末２Ｂ－２のＰＴＴボタンがオンにされたものとする（Ｓ１６９）。これを受けて、インターカム端末２Ｂ－２は、動作モードを送話モードに切り替える（Ｓ１７０）。そして、操作者Ｆの発話により入力された音声に対する音声認識処理を開始して、操作者Ｆの発話内容をテキストデータに変換する（Ｓ１７１）。

【0102】

その後、操作者Ｆによりインターカム端末２Ｂ－２のＰＴＴボタンがオフにされると（Ｓ１７２）、インターカム端末２Ｂ－２は、動作モードを送話モードから受話モードに切り替える（Ｓ１７３）。それから、音声認識処理を終了し（Ｓ１７４）、それまでに変換された操作者Ｆの発話内容のテキストデータを表示するとともに（Ｓ１７５）、このテキストデータを自インターカム端末２Ｂ－２以外のすべてのインターカム端末２Ｂ－１、２Ｂ－３に一斉送信する（Ｓ１７６）。

【0103】

インターカム端末２Ｂ－３は、動作モードが受話モードであるため、インターカム端末２Ｂ－１およびインターカム端末２Ｂ－２から操作者Ｅの発話内容のテキストデータおよび操作者Ｆの発話内容のテキストデータを順番に受信すると、操作者Ｅの発話内容のテキストデータおよび操作者Ｆの発話内容のテキストデータをその受信順に表示する（Ｓ１７７）。また、操作者Ｅの発話内容のテキストデータおよび操作者Ｆの発話内容のテキストデータをその受信順に音声変換して音声出力（音声読上げ）する（Ｓ１７８）。なお、インターカム端末２Ｂ－３の動作モードが送話モードである場合、テキストデータの表示（Ｓ１７７）のみを行い、テキストデータの音声読上げ（Ｓ１７８）は行わない。

【0104】

また、インターカム端末２Ｂ－１は、動作モードが送話モードから受話モードに切り替わっているため、インターカム端末２Ｂ－２より操作者Ｆの発話内容のテキストデータを受信すると、このテキストデータを表示する（Ｓ１７９）。また、操作者Ｆの発話内容のテキストデータを音声変換して音声出力（音声読上げ）する（Ｓ１８０）。なお、インターカム端末２Ｂ－１の動作モードが送話モードである場合、テキストデータの表示（Ｓ１７９）のみを行い、テキストデータの音声読上げ（Ｓ１８０）は行わない。

【0105】

同様に、インターカム端末２Ｂ－２は、動作モードが送話モードから受話モードに切り替わっているため、インターカム端末２Ｂ－１より操作者Ｅの発話内容のテキストデータを受信すると、このテキストデータを表示する（Ｓ１８１）。また、操作者Ｅの発話内容のテキストデータを音声変換して音声出力（音声読上げ）する（Ｓ１８２）。なお、インターカム端末２Ｂ－２の動作モードが送話モードである場合、テキストデータの表示（Ｓ１８１）のみを行い、テキストデータの音声読上げ（Ｓ１８２）は行わない。

【0106】

つぎに、本実施の形態に係るインターカムシステムを構成するインターカム端末２Ｂの詳細を説明する。

【0107】

図１２は、インターカム端末２Ｂの概略機能構成図である。

【0108】

図示するように、本実施の形態に用いるインターカム端末２Ｂが図５に示す上記第１実施の形態に用いるインターカム端末２と異なる点は、送信部２４に代えて一斉送信部３１を設けたこと、および端末情報記憶部３０を追加したことである。その他の構成は、図５に示す上記第１実施の形態に用いるインターカム端末２と同様である。

【0109】

端末情報記憶部３０には、自インターカム端末２Ｂ以外の各インターカム端末２Ｂのアドレス情報を含む端末情報が少なくとも記憶されている。

【0110】

一斉送信部３１は、端末情報記憶部３０を参照し、無線インターフェース部２０を介して自インターカム端末２Ｂ以外の各インターカム端末２Ｂに、音声認識部２３により変換されたテキストデータを一斉送信する。

【0111】

インターカム端末２Ｂの動作は、図６に示す上記第１実施の形態に用いるインターカム端末２の動作と同様である。ただし、図６のＳ３１２において、一斉送信部３１は、端末情報記憶部３０を参照し、自インターカム端末２Ｂ以外の各インターカム端末２Ｂに、音声認識部２３により変換されたテキストデータを無線インターフェース部２０から一斉送信する。この点において、上記第１実施の形態に用いるインターカム端末２の動作と異なる。

【0112】

以上、本発明の第３実施の形態について説明した。

【0113】

本実施の形態によれば、上記第１の実施の形態が有する効果に加えて、つぎの効果を有する。すなわち、ネットワーク３上にインターカムサーバ１を設置する必要がないため、その分のコストを抑制することができる。

【0114】

なお、本実施の形態においても、上記第１実施の形態に用いるインターカム端末２と同様に、インターカム端末２Ｂに音声認識部２３を搭載する代わりに、インターカム端末２Ｂが音声認識処理を外部の音声認識サーバに依頼してもよい。

【0115】

［第４実施の形態］
本発明の第４実施の形態に係るインターカムシステムが、図１０に示す本発明の第３実施の形態に係るインターカムシステムと異なる点は、インターカム端末２Ｂ－１～２Ｂ－３に代えてインターカム端末２Ｃ－１～２Ｃ－３（以下、単にインターカム端末２Ｃとも呼ぶ）を用いたことである。

【0116】

インターカム端末２Ｃは、ＰＴＴボタンのオン・オフで送話モードと受話モードとを切り替えることができる。そして、動作モードが送話モードの場合、操作者の入力音声を録音することにより得られる録音データおよびこの入力音声に音声認識処理を実施することにより得られるテキストデータを、自インターカム端末２Ｃ以外のすべてのインターカム端末２Ｃに一斉送信する。また、動作モードが受話モードの場合、他のインターカム端末２Ｃより受信した録音データを受信順に再生して出力するとともに、録音データとともに受信したテキストデータを受信順に表示する。

【0117】

図１３は、本発明の第４実施の形態に係るインターカムシステムの動作例を説明するためのシーケンス図である。

【0118】

インターカム端末２Ｃ－１～２Ｃ－３の動作モードは、デフォルトで受話モード（ＰＴＴボタンがオフ）に設定されているものとする（Ｓ１９０）。

【0119】

まず、インターカム端末２Ｃ－１の操作者（以下、操作者Ｇとする）により、インターカム端末２Ｃ－１のＰＴＴボタンがオンにされたものとする（Ｓ１９１）。これを受けて、インターカム端末２Ｃ－１は、動作モードを送話モードに切り替える（Ｓ１９２）。そして、操作者Ｇの発話により入力された音声の録音を開始するとともに、この入力音声に対する音声認識処理を開始して、操作者Ｇの発話内容をテキストデータに変換する（Ｓ１９３）。

【0120】

その後、操作者Ｇによりインターカム端末２Ｃ－１のＰＴＴボタンがオフにされると（Ｓ１９４）、インターカム端末２Ｃ－１は、動作モードを受話モードに切り替える（Ｓ１９５）。そして、録音および音声認識処理を終了し（Ｓ１９６）、それまでに変換された操作者Ｇの発話内容のテキストデータを表示するとともに（Ｓ１９７）、それまでに録音された操作者Ｇの発話内容の録音データを、このテキストデータとともに、自インターカム端末２Ｃ－１以外のすべてのインターカム端末２Ｃ－２、２Ｃ－３に一斉送信する（Ｓ１９８）。

【0121】

ここで、インターカム端末２Ｃ－１の動作モードが送話モードの間に（Ｓ１９２～Ｓ１９５）、インターカム端末２Ｃ－２の操作者（以下、操作者Ｈとする）によりインターカム端末２Ｃ－２のＰＴＴボタンがオンにされたものとする（Ｓ１９９）。これを受けて、インターカム端末２Ｃ－２は、動作モードを送話モードに切り替える（Ｓ２００）。そして、操作者Ｈの発話により入力された音声の録音を開始するとともに、この入力音声に対する音声認識処理を開始して、操作者Ｈの発話内容をテキストデータに変換する（Ｓ２０１）。

【0122】

その後、操作者Ｈによりインターカム端末２Ｃ－２のＰＴＴボタンがオフにされると（Ｓ２０２）、インターカム端末２Ｃ－２は、動作モードを受話モードに切り替える（Ｓ２０３）。そして、録音および音声認識処理を終了し（Ｓ２０４）、それまでに変換された操作者Ｈの発話内容のテキストデータを表示するとともに（Ｓ２０５）、それまでに録音された操作者Ｈの発話内容の録音データを、このテキストデータとともに、自インターカム端末２Ｃ－２以外のすべてのインターカム端末２Ｃ－１、２Ｃ－３に一斉送信する（Ｓ２０６）。

【0123】

インターカム端末２Ｃ－３は、動作モードが受話モードであるため、インターカム端末２Ｃ－１およびインターカム端末２Ｃ－２から、操作者Ｇの発話内容の録音データおよびテキストデータと、操作者Ｈの発話内容の録音データおよびテキストデータと、を順番に受信すると、操作者Ｇの発話内容のテキストデータおよび操作者Ｈの発話内容のテキストデータをその受信順に表示する（Ｓ２０７）。また、操作者Ｇの発話内容の録音データおよび操作者Ｈの発話内容の録音データをその受信順に再生して音声出力する（Ｓ２０８）。なお、インターカム端末２Ｃ－３の動作モードが送話モードである場合、テキストデータの表示（Ｓ２０７）のみを行い、録音データの再生出力（Ｓ２０８）は行わない。

【0124】

また、インターカム端末２Ｃ－１は、送話モードから受話モードに切り替わっているため、インターカム端末２Ｃ－２より操作者Ｈの発話内容の録音データおよびテキストデータを受信すると、この操作者Ｈの発話内容のテキストデータを表示する（Ｓ２０９）。また、操作者Ｈの発話内容の録音データを再生して音声出力する（Ｓ２１０）。なお、インターカム端末２Ｃ－１が送話モードである場合、テキストデータの表示（Ｓ２０９）のみを行い、録音データの再生出力（Ｓ２１０）は行わない。

【0125】

同様に、インターカム端末２Ｃ－２は、動作モードが送話モードから受話モードに切り替わっているため、インターカム端末２Ｃ－１より操作者Ｇの発話内容の録音データおよびテキストデータを受信すると、この操作者Ｇの発話内容のテキストデータを表示する（Ｓ２１１）。また、操作者Ｇの発話内容の録音データを再生して音声出力する（Ｓ２１２）。なお、インターカム端末２Ｃ－２の動作モードが送話モードである場合、テキストデータの表示（Ｓ２１１）のみを行い、録音データの再生出力（Ｓ２１２）は行わない。

【0126】

つぎに、本実施の形態に係るインターカムシステムを構成するインターカム端末２Ｃの詳細を説明する。

【0127】

図１４は、インターカム端末２Ｃの概略機能構成図である。

【0128】

図示するように、本実施の形態に用いるインターカム端末２Ｃが図８に示す上記第２実施の形態に用いるインターカム端末２Ａと異なる点は、送信部２４に代えて一斉送信部３３を設けたこと、および端末情報記憶部３２を追加したことである。その他の構成は、図８に示す上記第２実施の形態に用いるインターカム端末２Ａと同様である。

【0129】

端末情報記憶部３２には、自インターカム端末２Ｃ以外の各インターカム端末２Ｃのアドレス情報を含む端末情報が少なくとも記憶されている。

【0130】

一斉送信部３３は、端末情報記憶部３２を参照し、無線インターフェース部２０を介して自インターカム端末２Ｃ以外の各インターカム端末２Ｃに、録音部２８により録音された録音データを、音声認識部２３により変換されたテキストデータとともに一斉送信する。

【0131】

インターカム端末２Ｃの動作は、図９に示す上記第２実施の形態に用いるインターカム端末２Ａ動作と同様である。ただし、図９のＳ３３２において、一斉送信部３３は、端末情報記憶部３２を参照し、録音された録音データを、音声認識部２３により変換されたテキストデータとともに、無線インターフェース部２０から自インターカム端末２Ｃ以外の各インターカム端末２Ｃに一斉送信する。この点において、上記第２実施の形態に用いるインターカム端末２Ａの動作と異なる。

【0132】

以上、本発明の第４実施の形態について説明した。

【0133】

本実施の形態によれば、上記第２実施の形態が有する効果に加えて、つぎの効果を有する。すなわち、ネットワーク３上にインターカムサーバ１Ａを設置する必要がないため、その分のコストを抑制することができる。

【0134】

なお、本実施の形態においても、上記第２実施の形態に用いるインターカム端末２Ａと同様に、インターカム端末２Ｃに音声認識部２３を搭載する代わりに、インターカム端末２Ｃが音声認識処理を外部の音声認識サーバに依頼してもよい。

【0135】

また、本実施の形態においても、上記第２実施の形態に用いるインターカム端末２Ａと同様に、送話側のインターカム端末２Ｃにおいて、録音データのみを送信して、テキストデータの送信を省略してもかまわない。この場合、送話側のインターカム端末２Ｃにおける音声認識処理は不要である。また、この場合、受話側のインターカム端末２Ｃにおいて、送話側のインターカム端末２Ｃから受信した録音データに受信順に音声認識処理を実施してテキストデータに変換し、このテキストデータをマンマシンインターフェース部２１に表示することが好ましい。ここで、受話側のインターカム端末２Ｃは、自身で音声認識処理を実施するのではなく、外部の音声認識サーバに音声認識処理を依頼してもよい。

【0136】

本発明は上記の各実施の形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。

【0137】

また、上記第１実施の形態に用いるインターカムサーバ１（図３参照）、および上記第２実施の形態に用いるインターカムサーバ１Ａの機能構成は、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）、ＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）などの集積ロジックＩＣによりハード的に実現されるものでもよいし、あるいはＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）等の計算機によりソフトウエア的に実現されるものでもよい。または、ＣＰＵ、メモリ、フラッシュメモリ等の補助記憶装置、およびＮＩＣ（ＮｅｔｗｏｒｋＩｎｔｅｒｆａｃｅＣａｒｄ）等の通信インターフェースを備えたＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）において、ＣＰＵが所定のプログラムを補助記憶装置からメモリ上にロードして実行することで実現されるものでもよい。

【0138】

同様に、上記第１実施の形態に用いるインターカム端末２（図５参照）、上記第２実施の形態に用いるインターカム端末２Ａ（図８参照）、上記第３実施の形態に用いるインターカム端末２Ｂ（図１２参照）、および上記第４実施の形態に用いるインターカム端末２Ｃ（図１４参照）の機能構成は、ＡＳＩＣ、ＦＰＧＡなどの集積ロジックＩＣによりハード的に実現されるものでもよいし、あるいはＤＳＰ等の計算機によりソフトウエア的に実現されるものでもよい。または、ＣＰＵ、メモリ、フラッシュメモリ等の補助記憶装置、および無線アダプタ等の通信インターフェースを備えたスマートフォン、タブレットＰＣ等の携帯端末において、ＣＰＵが所定のプログラムを補助記憶装置からメモリ上にロードして実行することで実現されるものでもよい。

【符号の説明】

【0139】

１、１Ａ：インターカムサーバ
２、２－１～２－３、２Ａ、２Ａ－１～２Ａ－３、２Ｂ、２Ｂ－１～２Ｂ－３、２Ｃ、２Ｃ－１～２Ｃ－３：インターカム端末
３：ネットワーク４：無線アクセスポイント
１０：ネットワークインターフェース部１１、３０、３２：端末情報記憶部
１２：中継処理部２０：無線インターフェース部
２１：マンマシンインターフェース部２２：モード切替部
２３：音声認識部２４：送信部２５：受信部
２６：音声合成部２７：テキスト表示部２８：録音部２９：録音再生部
３１、３３：一斉送信部

【図1】