(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-01
(45)【発行日】2024-07-09
(54)【発明の名称】質問生成装置、質問生成方法、会話支援装置、プログラム、および記録媒体
(51)【国際特許分類】
G06F 40/56 20200101AFI20240702BHJP
G10L 15/22 20060101ALI20240702BHJP
G06Q 10/06 20230101ALI20240702BHJP
G06N 5/02 20230101ALI20240702BHJP
G06F 40/279 20200101ALI20240702BHJP
【FI】
G06F40/56
G10L15/22 453
G06Q10/06
G06N5/02
G06F40/279
(21)【出願番号】P 2020046913
(22)【出願日】2020-03-17
【審査請求日】2023-02-09
(73)【特許権者】
【識別番号】000232092
【氏名又は名称】NECソリューションイノベータ株式会社
(74)【代理人】
【識別番号】100115255
【氏名又は名称】辻丸 光一郎
(74)【代理人】
【識別番号】100201732
【氏名又は名称】松縄 正登
(74)【代理人】
【識別番号】100154081
【氏名又は名称】伊佐治 創
(72)【発明者】
【氏名】ファン タァン クァン
(72)【発明者】
【氏名】山本 純一
【審査官】齊藤 貴孝
(56)【参考文献】
【文献】特開2019-109789(JP,A)
【文献】国際公開第2018/015999(WO,A1)
【文献】特開2009-026108(JP,A)
【文献】国際公開第2018/230551(WO,A1)
【文献】国際公開第2015/093539(WO,A1)
【文献】特開2011-192191(JP,A)
【文献】特表2006-525601(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-40/58
G10L 15/00-15/34
G06Q 10/00-99/00
G06N 5/00- 5/048
(57)【特許請求の範囲】
【請求項1】
標準単語ネットワーク生成部、会話データ取得部、テキストデータ抽出部、観点単語抽出部、質問生成部、出力部を含み、
前記標準単語ネットワーク生成部は、インターネットで公開されたテキスト情報をクロールして標準単語ネットワークを生成し、
前記会話データ取得部は、会話データを取得し、
前記会話データは、会話が記録された情報であり、
前記テキストデータ抽出部は、前記会話データからテキストデータを抽出し、
前記テキストデータに基づき、前記会話中の単語の関連性を示す会話ネットワークを生成し、
前記会話ネットワークに基づき、前記会話の中心となる中心単語を抽出し、
前記観点単語抽出部は、前記テキストデータから、前記中心単語が含まれる会話ネットワークと、前記標準単語ネットワークとを比較し、前記標準単語ネットワークに含まれ、かつ、前記会話ネットワークに含まれない単語を、前記会話に不足する観点を示す不足観点単語として抽出し、
前記質問生成部は、前記不足観点単語に基づく質問を生成し、
前記出力部は、前記質問を出力する、ことを特徴とする質問生成装置。
【請求項2】
前記観点単語抽出部は、前記会話ネットワークと、前記標準単語ネットワークとを比較し、前記会話ネットワークに含まれ、かつ、前記標準単語ネットワークに含まれない単語を、前記標準単語ネットワークに追加する、請求項1に記載の質問生成装置。
【請求項3】
前記質問生成部は、前記抽出した不足観点単語の感情を分析し、前記不足観点単語がネガティブな単語の場合、前記不足観点単語の対義語に基づく質問を生成する、請求項1または2記載の質問生成装置。
【請求項4】
前記会話データは、会話データが記録されたチャットルームを識別するチャンネル情報を含み、
前記出力部は、前記チャンネル情報に基づき、前記会話データが記録されたチャットルームに、前記質問を出力する、請求項1から3のいずれか一項に記載の質問生成装置。
【請求項5】
標準単語ネットワーク生成工程、会話データ取得工程、テキストデータ抽出工程、観点単語抽出工程、質問生成工程、出力工程を含み、
前記標準単語ネットワーク生成工程は、インターネットで公開されたテキスト情報をクロールして標準単語ネットワークを生成し、
前記会話データ取得工程は、会話データを取得し、
前記会話データは、会話が記録された情報であり、
前記テキストデータ抽出工程は、前記会話データからテキストデータを抽出し、
前記テキストデータに基づき、前記会話中の単語の関連性を示す会話ネットワークを生成し、
前記会話ネットワークに基づき、前記会話の中心となる中心単語を抽出し、
前記観点単語抽出工程は、前記テキストデータから、前記中心単語が含まれる会話ネットワークと、前記標準単語ネットワークとを比較し、前記標準単語ネットワークに含まれ、かつ、前記会話ネットワークに含まれない単語を、前記会話に不足する観点を示す不足観点単語として抽出し、
前記質問生成工程は、前記不足観点単語に基づく質問を生成し、
前記出力工程は、前記質問を出力し、
前記
標準単語ネットワーク生成工程、前記会話データ取得工程、前記テキストデータ抽出工程、前記観点単語抽出工程、前記質問生成工程、および前記出力工程が、コンピュータにより実行される、ことを特徴とする質問生成方法。
【請求項6】
インターネットで公開されたテキスト情報をクロールして標準単語ネットワークを生成する標準単語ネットワーク生成手順、
会話が記録された情報である会話データを取得する会話データ取得手順、
前記会話データからテキストデータを抽出するテキストデータ抽出手順、
前記テキストデータに基づき、前記会話中の単語の関連性を示す会話ネットワークを生成し、
前記会話ネットワークに基づき、前記会話の中心となる中心単語を抽出し、
前記テキストデータから、前記中心単語が含まれる会話ネットワークと、前記標準単語ネットワークとを比較し、前記標準単語ネットワークに含まれ、かつ、前記会話ネットワークに含まれない単語を、前記会話に不足する観点を示す不足観点単語として抽出する観点単語抽出手順、
前記不足観点単語に基づく質問を生成する質問生成手順、および
前記質問を出力する出力手順を、コンピュータに実行させるためのプログラム。
【請求項7】
請求項6に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項8】
請求項1から4のいずれか一項に記載の質問生成装置を含む、会話支援装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、質問生成装置、質問生成方法、会話支援装置、プログラム、および記録媒体に関する。
【背景技術】
【0002】
企業等の組織においては、人事に関するデータを把握し、さらに、前記組織に属する従業員等の個人に対しても、定期的にアンケートの実施を行っている。しかしながら、人事に関するデータもアンケートも、現状の組織の状態を把握するツールにとどまっている。
【0003】
また、組織に対する従業員の満足等を分析するシステムも提案されている(特許文献1)。しかしながら、このシステムも、あくまでも現状の状態を把握するシステムにとどまっている。
【0004】
他方、組織は、現状の把握も重要であるが、把握した現状に対し、どのように対処するかが極めて重要である。現在、組織改革のため、従業員に対する研修等が行われている。しかしながら、選抜された人材に研修を行っても、日常業務への負担感等から、職場では研修内容が実施されないという問題がある。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、組織開発の手法として、診断型組織開発と、対話型組織開発が知られている。診断型組織開発は、解決可能な課題の解決施策を見つけるのに対し、対話型組織開発は、解決案が出現する在り方や関係性を対話により作り出す方法である。対話型組織開発は、そもそもの組織内における共通の視点や観点(ディスコースともいう)について、対話による変革を行うことで、組織の変革を促すことができる。
【0007】
対話型組織開発を行うためには、組織の構成員が対話を行い、ディスコースを変えるような視点・観点からの生成的質問について議論する必要がある。しかしながら、日常の会話の中で、組織の構成員自らがこのような気付きを得ることは困難である。また、このような議論を行うことは、日常業務への負荷が大きいという問題もある。
【0008】
そこで、本発明は、日常業務への負荷を抑制しつつ、会話の中で不足する観点に繋がる質問を生成する装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
前記目的を達成するために、本発明の質問生成装置は、会話データ取得部、テキストデータ抽出部、観点単語抽出部、質問生成部、出力部を含み、
前記会話データ取得部は、会話データを取得し、
前記テキストデータ抽出部は、前記会話データからテキストデータを抽出し、
前記観点単語抽出部は、前記テキストデータから、前記会話に不足する観点を示す不足観点単語を抽出し、
前記質問生成部は、前記不足観点単語に基づく質問を生成し、
前記出力部は、前記質問を出力することを特徴とする。
【0010】
本発明の質問生成方法は、会話データ取得工程、テキストデータ抽出工程、観点単語抽出工程、質問生成工程、出力工程を含み、
前記会話データ取得工程は、会話データを取得し、
前記テキストデータ抽出工程は、前記会話データからテキストデータを抽出し、
前記観点単語抽出工程は、前記テキストデータから、前記会話に不足する観点を示す不足観点単語を抽出し、
前記質問生成工程は、前記不足観点単語に基づく質問を生成し、
前記出力工程は、前記質問を出力することを特徴とする。
【0011】
本発明のプログラムは、会話データを取得する会話データ取得手順、
前記会話データからテキストデータを抽出するテキストデータ抽出手順、
前記テキストデータから、前記会話に不足する観点を示す不足観点単語を抽出する観点単語抽出手順、
前記不足する観点単語に基づく質問を生成する質問生成手順、および
前記質問を出力する出力手順を、コンピュータに実行させるためのプログラムである。
【0012】
本発明の記録媒体は、前記本発明のプログラムを記録したコンピュータ読み取り可能である。
【0013】
本発明の会話支援装置は、前記本発明の質問生成装置を含むことを特徴とする。
【発明の効果】
【0014】
本発明によれば、日常業務への負荷を抑制しつつ、会話の中で不足する観点に繋がる質問を生成できる。
【図面の簡単な説明】
【0015】
【
図1】
図1(A)は、実施形態1の質問生成装置の構成の一例を示すブロック図であり、
図1(B)は、実施形態1の質問生成システムの構成の一例を示す概略図である。
【
図2】
図2は、実施形態1の質問生成装置のハードウェア構成の一例を示すブロック図である。
【
図3】
図3は、実施形態1の質問生成方法およびプログラムの一例を示すフローチャートである。
【
図4】
図4は、実施形態1の質問生成方法における工程の一部の例を示す模式図である。
【発明を実施するための形態】
【0016】
本発明において、組織とは、特に制限されず、例えば、複数の個人が連携している団体であり、会社等の法人、役所、病院、地域コミュニティ等があげられる。前記組織の単位は、特に制限されず、例えば、会社でもよいし、会社における部署またはグループ等でもよい。
【0017】
つぎに、本発明の実施形態について説明する。なお、本発明は、以下の実施形態には限定されない。なお、以下の各図において、同一部分には、同一符号を付している。また、各実施形態の説明は、特に言及がない限り、互いの説明を援用できる。さらに、各実施形態の構成は、特に言及がない限り、組合せ可能である。
【0018】
[実施形態1]
実施形態1は、本発明の質問生成装置および質問生成方法に関する。
【0019】
本実施形態は、本発明の質問生成装置の例である。
図1(A)は、実施形態1の質問生成装置1の一例を示すブロック図であり、
図1(B)は、実施形態1の質問生成装置1を有する質問生成システム装置100の一例を示す概略図である。
図1(A)に示すように、本実施形態の質問生成装置1は、会話データ取得部11、テキストデータ抽出部12、観点単語抽出13、質問生成部14、および、出力部15を含む。図示していないが、質問生成装置1は、例えば、記憶部を有してもよい。また、
図1(B)に示すように、質問生成装置1は、例えば、通信回線網30を介して、データベース(DB)40、外部端末50と接続可能である。前記データベース40には、例えば、後述する会話データ、標準単語ネットワーク、対義語データ、および質問データが記憶されている。質問生成装置が前記記憶部を有する場合、前記記憶部として、データベース40を有してもよい。本実施形態の質問生成装置1は、システムとしてサーバに組み込まれていてもよい。また、本実施形態の質問生成装置1は、本発明のプログラムがインストールされたパーソナルコンピュータ(PC)であってもよい。また、図示していないが、質問生成装置1は、通信回線網30を介して、システム管理者の外部端末とも接続可能であり、システム管理者は、外部端末から質問生成装置1の管理を実施してもよい。質問生成装置1は、例えば、前記各部を含む1つの装置でもよいし、前記各部が、通信回線網を介して接続可能な装置でもよい。質問生成装置1は、例えば、各部の処理がクラウド上で行われてもよい。
【0020】
通信回線網30は、特に制限されず、公知のネットワークを使用でき、例えば、有線でもよいし、無線でもよい。通信回線網30は、例えば、インターネット回線、WWW(World Wide Web)、電話回線、LAN(Local Area Network)、WiFi(Wireless Fidelity)、LPWA(Low Power Wide Area)等があげられる。
【0021】
図2に、質問生成装置1のハードウェア構成のブロック図を例示する。質問生成装置1は、例えば、CPU(中央処理装置)101、メモリ102、バス103、記憶装置104、入力装置106、ディスプレイ107、通信デバイス108等を有する。質問生成装置1の各部は、それぞれのインタフェース(I/F)により、バス103を介して接続されている。
【0022】
CPU101は、例えば、コントローラ(システムコントローラ、I/Oコントローラ等)等により、他の構成と連携動作し、質問生成装置1の全体の制御を担う。質問生成装置1において、CPU101により、例えば、本発明のプログラム105やその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的には、例えば、CPU101が、会話データ取得部11、テキストデータ抽出部12、観点単語抽出13、質問生成部14、および、出力部15として機能する。質問生成装置1は、演算装置として、CPUを備えるが、GPU(Graphics Processing Unit)、APU(Accelerated Processing Unit)等の他の演算装置を備えてもよいし、CPUとこれらとの組合せを備えてもよい。なお、CPU101は、例えば、後述する実施形態における記憶部以外の各部として機能する。
【0023】
メモリ102は、例えば、メインメモリを含む。前記メインメモリは、主記憶装置ともいう。CPU101が処理を行う際には、例えば、後述する記憶装置104(補助記憶装置)に記憶されている本発明のプログラム105等の種々の動作プログラムを、メモリ102が読み込む。そして、CPU101は、メモリ102からデータを読み出し、解読し、前記プログラムを実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。メモリ102は、例えば、さらに、ROM(読み出し専用メモリ)を含む。
【0024】
バス103は、例えば、外部機器とも接続できる。前記外部機器は、例えば、質問生成端末2;外部記憶装置(データベース40等);プリンター;等があげられる。質問生成装置1は、例えば、バス103に接続された通信デバイス108により、通信回線網30に接続でき、通信回線網30を介して、前記外部機器と接続することもできる。前記外部機器との接続方式は、通信回線網30を介した接続には限定されず、例えば、有線による接続でもよいし、無線通信を利用した接続でもよい。前記有線による接続は、例えば、コードによる接続でもよいし、通信回線網を利用するためのケーブル等による接続でもよい。
【0025】
記憶装置104は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶装置104には、本発明のプログラム105を含む動作プログラムが格納されている。記憶装置104は、例えば、記憶媒体と、前記記憶媒体に読み書きするドライブとを含む。前記記憶媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、FD(フロッピー(登録商標)ディスク)、CD-ROM、CD-R、CD-RW、MO、DVD、フラッシュメモリー、メモリーカード等があげられ、前記ドライブは、特に制限されない。記憶装置104は、例えば、前記記憶媒体と前記ドライブとが一体化されたハードディスクドライブ(HDD)であってもよい。
【0026】
質問生成装置1は、例えば、さらに、入力装置106、ディスプレイ107を有する。入力装置106は、例えば、タッチパネル、トラックパッド、マウス等のポインティングデバイス;キーボード;カメラ、スキャナ等の撮像手段;ICカードリーダ、磁気カードリーダ等のカードリーダ;マイク等の音声入力手段;等があげられる。ディスプレイ107は、例えば、LEDディスプレイ、液晶ディスプレイ等の表示装置があげられる。本実施形態1において、入力装置106とディスプレイ107とは、別個に構成されているが、入力装置106とディスプレイ107とは、タッチパネルディスプレイのように、一体として構成されてもよい。
【0027】
質問生成装置1において、メモリ102及び記憶装置104は、ユーザからのアクセス情報及びログ情報、ならびに、データベース40から取得した情報を記憶することも可能である。
【0028】
質問生成装置1の各部について、さらに詳細に説明する。
【0029】
会話データ取得部11は、会話データを取得する。前記会話データは、例えば、組織の構成員の会話が記録された情報であり、テキスト情報でも、音声情報でもよい。前記会話データがテキスト情報である場合、具体例として、チャットツールのログ情報があげられる。前記テキスト情報は、例えば、質問生成装置1の記憶装置104に記録されていてもよいし、質問生成装置1外のデータベース40に記録されていてもよい。また、前記チャットツールが記憶部を有する場合、前記テキスト情報は、例えば、前記チャットツールの記憶部に記録されていてもよい。前記会話データが質問生成装置1の記憶装置104に記憶されている場合、会話データ取得部11は、記憶装置104の前記会話データを読み取ることで取得できる。前記会話データがデータベース40または前記チャットツールの記憶部に記憶されている場合、会話データ取得部11は、通信回線網30を介して前記会話データを取得できる。
【0030】
前記会話データが、前記チャットツールのログ情報である場合、前記会話データは、例えば、前記会話データが記録されたチャットルームを識別するチャンネル情報を含むことが好ましい。前記会話データが、音声情報である場合、例えば、会話データ取得部11は、マイクなどの音声入力手段により、前記会話データを取得でき、入力された音声情報を、テキスト情報に変換して取得することが好ましい。前記音声情報をテキスト情報に変換する手段は、特に制限されず、例えば、公知の音声情報をテキスト情報に変換するソフトウェアが使用できる。
【0031】
テキストデータ抽出部12は、前記会話データからテキストデータを抽出する。前記抽出は、例えば、特に制限されず、公知の自然言語処理手段が利用できる。前記自然言語処理手段としては、例えば、形態素解析等があげられる。
【0032】
テキストデータ抽出部12は、例えば、前記会話データから抽出したテキストデータ基づき、会話中の単語の関連性を示す会話ネットワークを生成してもよい。前記会話ネットワークは、例えば、前記テキストデータを共起分析に供することで生成できる。また、テキストデータ抽出部12は、前記会話ネットワークに基づき、会話の中心となる中心単語を抽出してもよい。前記中心単語は、例えば、前記会話ネットワークに含まれる各単語の次数を比較し、最も次数が高い単語を中心単語として抽出することができる。
【0033】
観点単語抽出部13は、前記テキストデータから、前記会話に不足する観点を示す不足観点単語を抽出する。前記不足観点単語の抽出は、例えば、観点単語が記憶されたデータベースを用い、前記テキストデータの単語と、前記データベースの単語とを比較し、前記データベースに含まれ、前記テキストデータに含まれない単語を抽出すればよい。
【0034】
テキストデータ抽出部12が、前記会話ネットワークを生成している場合、観点単語抽出部13は、例えば、前記中心単語が含まれる会話ネットワークと、標準単語ネットワークとを比較し、前記標準単語ネットワークに含まれ、かつ、前記会話ネットワークに含まれない単語を、前記会話に不足する観点を示す不足観点単語として抽出する。
【0035】
前記標準単語ネットワークは、例えば、組織において推奨される視点または観点を有する単語のつながりを示すネットワークであることが好ましい。前記標準単語ネットワークは、例えば、各単語のつながりと、それらの共起度とが紐づけられてデータベース40に記憶されている。前記標準単語ネットワークに含まれ、かつ、前記会話ネットワークに含まれない単語が複数ある場合、観点単語抽出部13は、例えば、前記会話ネットワークに含まれない複数の単語について、標準単語ネットワークにおける前記中心単語との共起度を比較し、前記中心単語との共起度が最も高い単語を、不足観点単語として抽出すればよい。なお、これには制限されず、観点単語抽出部13は、前記複数の単語のうち、任意の単語を不足観点単語として抽出してもよい。また、前記会話ネットワークと、標準単語ネットワークとの比較は、例えば、まず前記中心単語からのつながりが1次の次元について比較し、差がなかった場合、2次、3次と、段階的に比較することが好ましい。
【0036】
前記標準単語ネットワークは、例えば、インターネット上に公開されたテキスト情報をクロールすることで生成できる。前記クロールする対象となるウェブサイトは、特に制限されず、例えば、ユーザの目的、ユーザが所属する組織が扱う情報の種類等に応じて適宜設定できる。具体的には、前記組織がパブリックな情報を扱う組織である場合、例えば、政府組織および官公庁のウェブサイト等をクロール対象とできる。また、前記組織が流行の情報を扱う組織である場合、例えば、ニュースサイト等をクロール対象とできる。
【0037】
観点単語抽出部13は、例えば、前記会話ネットワークと、前記標準単語ネットワークとを比較し、前記会話ネットワークに含まれ、かつ、前記標準単語ネットワークに含まれない単語がある場合、前記単語を、前記標準単語ネットワークに追加してもよい。
【0038】
質問生成部14は、前記不足観点単語に基づく質問を生成する。具体的には、質問生成部14は、例えば、データベース40に記憶された前記質問データから、前記不足観点単語をキーワードとして検索し、ヒットした質問を抽出することで質問を生成できる。前記ヒットした質問が複数ある場合、質問生成部14は、前記ヒットした質問の中から、任意の質問を抽出できる。この場合、質問生成部14は、例えば、乱数を用いて、前記ヒットした複数の質問の中からランダムな質問を抽出する。前記質問データは、特に制限されず、例えば、いわゆるコーチングノウハウに基づいた質問を含むことが好ましい。前記コーチングとは、例えば、対象者に対して自己の問題点に関する自覚などを促すことで、自発的な行動変革を実現させる技術である。前記コーチングノウハウに基づいた質問の具体例としては、例えば、「あなたの最高の思い出は何ですか?」、「あなたが時間を忘れて夢中になるものは?」、「なぜか人より容易にできてしまった仕事は?」、および「あなたがいつも続けていることは?」等があげられる。
【0039】
前記検索において、質問がヒットしなかった場合の処理について説明する。この場合、まず、観点単語抽出部13により、新たな不足観点単語を抽出する。具体的には、観点単語抽出部13は、例えば、前記標準単語ネットワークにおいて、前記検索に使用した不足観点単語(以下、説明の便宜上、「第1の不足観点単語」ともいう)とつながりのある単語を、候補単語として抽出する。つぎに、観点単語抽出部13は、前記会話ネットワークと、前記標準単語ネットワークとを比較し、前記会話ネットワークにおいて、他の単語とつながりがない前記候補単語のみをさらに抽出する。そして、観点単語抽出部13は、前記抽出した候補単語を、新たな不足観点単語として選択する。観点単語抽出部13は、前記候補単語のうち、前記標準単語ネットワークにおいて前記第1の不足観点単語との共起度が最も高い候補単語を、前記新たな不足観点単語として選択することが好ましい。そして、質問生成部14は、前記新たな不足観点単語をキーワードとして、データベース40を検索する。その後、質問がヒットするまで、観点単語抽出部13および質問生成部14による処理を繰り返す。
【0040】
質問生成部14は、これには制限されず、例えば、汎用の質問テンプレートを使用し、前記不足観点単語を質問テンプレートに入力することで質問を生成してもよい。前記質問テンプレートの具体例としては、例えば、「(不足観点)についてどう思いますか?」、「もし、(不足観点)が間違いだったら?」、「(不足観点)がなかったら、どうなる?」および「(不足観点)を忘れないようにするには?」等があげられる。
【0041】
質問生成部14は、例えば、前記抽出した不足観点単語の感情を分析し、前記不足観点単語がネガティブな単語の場合、前記不足観点単語の対義語に基づく質問を生成してもよい。前記感情の分析は、例えば、公知のポジネガ分析方法により分析できる。この場合、例えば、データベース40には、複数の単語の対義語データが記憶されており、質問生成部14は、ネガティブな感情を有すると判定された不足観点単語でデータベース40を検索し、ヒットした対義語を、新たな不足観点単語として、質問を生成する。
【0042】
質問生成部14は、例えば、前記質問データについて、前記不足観点単語に基づくスコアを算出し、前記スコアに基づいて質問を生成してもよい。前記スコアは、例えば、前記質問が、前記不足観点単語にどの程度マッチングしているかを示すスコアである。質問生成部14は、前記スコアが最高値を示す質問を生成してもよいし、スコア順で質問をランキングし、任意の順序の質問を生成してもよい。
【0043】
出力部15は、前記質問を出力する。前記質問の出力先は、特に制限されず、例えば、質問生成装置1のディスプレイ107、外部端末50等があげられる。外部端末50は、例えば、前記組織の構成員の端末である。前記会話データが、前記チャンネル情報を有する場合、出力部15は、例えば、前記チャンネル情報に基づき、前記会話データが記録されたチャットルーム(チャットツール)に前記質問を出力することが好ましい。
【0044】
つぎに、本実施形態の質問生成方法の具体例について、
図3のフローチャートおよび
図4を用いて説明する。ただし、本発明は、以下の具体例には何ら制限されない。本実施形態の質問生成方法は、例えば、本実施形態の質問生成装置1を備える質問生成システム100を用いて実施できる。本実施形態の質問生成方法は、質問生成システム100の使用には限定されない。なお、特に示さない限り、本実施形態の質問生成装置1および質問生成システム100の説明を援用でき、以下の説明は、本実施形態の質問生成装置1および質問生成システム100の説明に援用できる。
【0045】
まず、質問生成装置1による処理に先立ち、データベース40に、前記会話データとして、チャットツールのログ情報を記録する。前記ログ情報には、前記会話が行われたチャットルームの識別情報(チャンネル情報)が紐づけて記憶されている。また、データベース40には、予め、前述の標準単語ネットワーク、質問データ、および対義語データが記憶されている。
【0046】
(S101)会話データ取得工程
まず、会話データ取得部11により、通信回線網30を介して、データベース40から会話データを取得する。取得した会話データは、質問生成装置1の記憶装置104に記憶してもよい。
【0047】
(S102)テキストデータ抽出工程
つぎに、テキストデータ抽出部12により、前記会話データについて、形態素解析を行い、テキストデータを抽出する。そして、抽出した前記テキストデータについて、共起分析を行い、
図4(A)に示すような、会話中の単語の関連性を示す会話ネットワークを生成し、前記会話ネットワークにおいて、次数が最も高い単語を、会話の中心を示す中心単語として抽出する。
【0048】
(S103)観点単語抽出工程
つぎに、観点単語抽出部13により、前記中心単語が含まれる会話ネットワークと、データベース40に記憶されている標準単語ネットワークとを比較し、前記標準単語ネットワークに含まれ、かつ、前記会話ネットワークに含まれない単語を、前記会話に不足する観点を示す不足観点単語として抽出する。前記不足観点単語の抽出について、
図4(B)を用いて説明する。
図4(B)は、会話ネットワークと、標準単語ネットワークの一例を示す模式図であり、左側のネットワークが、会話ネットワークを示し、右側のネットワークが、標準単語ネットワークを示す。
図4(B)において、標準単語ネットワークの単語間を結ぶ枝上に記載されている数値は、単語間の共起度を示す。
図4(B)に示すように、生成された中心単語をAとする会話ネットワークと、同じく中心単語をAとする標準単語ネットワークとを比較すると、単語Dおよび単語Eが、標準単語ネットワークに含まれるのに対し、会話ネットワークには含まれていないことがわかる。このため、観点単語抽出部13は、標準単語ネットワークにおいて、単語Dおよび単語Eの共起度を比較し、より共起度の高い単語Dを、前記会話ネットワークに不足する不足観点単語として抽出する。
【0049】
また、前記観点単語抽出工程において、
図4(C)に示すように、前記会話ネットワークと、前記標準単語ネットワークとを比較した際、前記会話ネットワークに含まれ、かつ、前記標準単語ネットワークに含まれない単語が存在する場合、観点単語抽出部13は、前記単語を前記標準単語ネットワークに追加し、標準単語ネットワークを更新する。
図4(C)に示す例では、中心単語をAとする会話ネットワークに単語DおよびEが含まれるのに対し、標準単語ネットワークには含まれていないことがわかる。このため、標準単語ネットワークに、単語DおよびEを、中心単語Aとの共起度とともに追加し、標準単語ネットワークを更新する。
【0050】
(S104)質問生成工程
つぎに、質問生成部14により、前記不足観点単語に基づく質問を生成する。前記質問の生成は、例えば、前述の通りである。
【0051】
(S105)出力工程
そして、出力部15により、前記生成した質問を、前記会話データが含むチャンネル情報に基づき、会話データが記録されたチャットルームに出力し、処理を終了する(END)。
【0052】
[実施形態2]
実施形態2は、本発明の会話支援装置に関する。本発明の会話支援装置は、例えば、前記本発明の質問生成装置を含むことを特徴とし、その他の構成および条件は、何ら制限されない。本発明の会話支援装置は、本発明の質問生成装置および質問生成方法の説明を援用できる。本発明の会話支援装置は、前記本発明の質問生成装置を含むため、例えば、会話の中で不足する観点に繋がる質問を生成できる。
【0053】
[実施形態3]
本実施形態のプログラムは、前記実施形態1の質問生成方法の各工程を、コンピュータに実行させるためのプログラムである。本実施形態のプログラムは、会話データを取得する会話データ取得手順、前記会話データからテキストデータを抽出するテキストデータ抽出手順、前記テキストデータから、前記会話に不足する観点を示す不足観点単語を抽出する観点単語抽出手順、前記不足する観点単語に基づく質問を生成する質問生成手順、および前記質問を出力する出力手順を、コンピュータに実行させるためのプログラムである。
【0054】
本実施形態のプログラムは、例えば、前記本発明の質問生成装置及び質問生成方法における記載を援用できる。また、前記各手順は、例えば、「手順」を「処理」と読み替え可能である。また、本実施形態のプログラムは、例えば、コンピュータ読み取り可能な記録媒体に記録されてもよい。前記記録媒体は、例えば、非一時的なコンピュータ可読記録媒体(non-transitory computer-readable storage medium)である。前記記録媒体は、特に制限されず、例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、ハードディスク(HD)、光ディスク、フロッピー(登録商標)ディスク(FD)等があげられる。
【0055】
以上、実施形態を参照して本願発明を説明したが、本願発明は、上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
【0056】
<付記>
上記の実施形態及び実施例の一部又は全部は、以下の付記のように記載されうるが、以下には限られない。
(付記1)
会話データ取得部、テキストデータ抽出部、観点単語抽出部、質問生成部、出力部を含み、
前記会話データ取得部は、会話データを取得し、
前記テキストデータ抽出部は、前記会話データからテキストデータを抽出し、
前記観点単語抽出部は、前記テキストデータから、前記会話に不足する観点を示す不足観点単語を抽出し、
前記質問生成部は、前記不足観点単語に基づく質問を生成し、
前記出力部は、前記質問を出力する、ことを特徴とする質問生成装置。
(付記2)
前記テキストデータ抽出部は、
前記テキストデータに基づき、会話中の単語の関連性を示す会話ネットワークを生成し、
前記会話ネットワークに基づき、前記会話の中心となる中心単語を抽出し、
前記観点単語抽出部は、
前記会話ネットワークにおいて、前記中心単語が含まれる会話ネットワークと、標準単語ネットワークとを比較し、前記標準単語ネットワークに含まれ、かつ、前記会話ネットワークに含まれない単語を、前記会話に不足する観点を示す不足観点単語として抽出する、付記1に記載の質問生成装置。
(付記3)
前記観点単語抽出部は、前記会話ネットワークと、前記標準単語ネットワークとを比較し、前記会話ネットワークに含まれ、かつ、前記標準単語ネットワークに含まれない単語を、前記標準単語ネットワークに追加する、付記2に記載の質問生成装置。
(付記4)
前記質問生成部は、前記抽出した不足観点単語の感情を分析し、前記不足観点単語がネガティブな単語の場合、前記不足観点単語の対義語に基づく質問を生成する、付記1から3のいずれかに記載の質問生成装置。
(付記5)
前記質問生成部は、前記質問データについて、前記観点単語に基づくスコアを算出し、前記スコアに基づいて質問を生成する、付記1から4のいずれかに記載の質問生成装置。
(付記6)
前記会話データは、会話データが記録されたチャットルームを識別するチャンネル情報を含み、
前記出力部は、前記チャンネル情報に基づき、前記会話データが記録されたチャットルームに、前記質問を出力する、付記1から5のいずれかに記載の質問生成装置。
(付記7)
会話データ取得工程、テキストデータ抽出工程、観点単語抽出工程、質問生成工程、出力工程を含み、
前記会話データ取得工程は、会話データを取得し、
前記テキストデータ抽出工程は、前記会話データからテキストデータを抽出し、
前記観点単語抽出工程は、前記テキストデータから、前記会話に不足する観点を示す不足観点単語を抽出し、
前記質問生成工程は、前記不足観点単語に基づく質問を生成し、
前記出力工程は、前記質問を出力する、ことを特徴とする質問生成方法。
(付記8)
前記テキストデータ抽出工程は、
前記テキストデータに基づき、会話中の単語の関連性を示す会話ネットワークを生成し、
前記会話ネットワークに基づき、前記会話の中心となる中心単語を抽出し、
前記観点単語抽出工程は、
前記会話ネットワークにおいて、前記中心単語が含まれる会話ネットワークと、標準単語ネットワークとを比較し、前記標準単語ネットワークに含まれ、かつ、前記会話ネットワークに含まれない単語を、前記会話に不足する観点を示す不足観点単語として抽出する、付記7に記載の質問生成方法。
(付記9)
前記観点単語抽出工程は、
前記会話ネットワークと、前記標準単語ネットワークとを比較し、前記標準単語ネットワークに含まれない単語を、前記標準単語ネットワークに追加する、付記8に記載の質問生成方法。
(付記10)
前記質問生成工程は、前記抽出した不足観点単語の感情を分析し、前記不足観点単語がネガティブな単語の場合、前記不足観点単語の対義語に基づく質問を生成する、付記7から9のいずれかに記載の質問生成方法。
(付記11)
前記会話データは、会話データが記録されたチャットルームを識別するチャンネル情報を含み、
前記出力工程は、前記チャンネル情報に基づき、前記会話データが記録されたチャットルームに、前記質問を出力する、付記7から10のいずれかに記載の質問生成方法。
(付記12)
会話データを取得する会話データ取得手順、
前記会話データからテキストデータを抽出するテキストデータ抽出手順、
前記テキストデータから、前記会話に不足する観点を示す不足観点単語を抽出する観点単語抽出手順、
前記不足する観点単語に基づく質問を生成する質問生成手順、および
前記質問を出力する出力手順を、コンピュータに実行させるためのプログラム。
(付記13)
前記テキストデータ抽出手順は、
前記テキストデータに基づき、会話中の単語の関連性を示す会話ネットワークを生成し、
前記会話ネットワークに基づき、会話の中心となる中心単語を抽出し、
前記観点単語抽出手順は、
前記会話ネットワークにおいて、前記中心単語が含まれる会話ネットワークと、標準単語ネットワークとを比較し、前記標準単語ネットワークに含まれ、かつ、前記会話ネットワークに含まれない単語を、前記会話に不足する観点を示す不足観点単語として抽出する、付記12に記載のプログラム。
(付記14)
前記観点単語抽出手順は、
前記会話ネットワークと、前記標準単語ネットワークとを比較し、前記標準単語ネットワークに含まれない単語を、前記標準単語ネットワークに追加する、付記13に記載のプログラム。
(付記15)
前記質問生成手順は、前記抽出した不足観点単語の感情を分析し、前記不足観点単語がネガティブな単語の場合、前記不足観点単語の対義語に基づく質問を生成する、付記12から14のいずれかに記載のプログラム。
(付記16)
前記会話データは、会話データが記録されたチャットルームを識別するチャンネル情報を含み、
前記出力手順は、前記チャンネル情報に基づき、前記会話データが記録されたチャットルームに、前記質問を出力する、付記12から15のいずれかに記載のプログラム。
(付記17)
付記12から15のいずれかに記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
(付記18)
付記1から6のいずれかに記載の質問生成装置を含む、会話支援装置。
【産業上の利用可能性】
【0057】
本発明によれば、対話に不足する観点に基づく質問を生成できるため、例えば、組織の構成員に対し、自分では気づくことが難しい視点や観点を自覚させることができる。このため、組織開発や、構成員のエンゲージメント向上の分野に利用できる。
【符号の説明】
【0058】
1 質問生成装置
11 会話データ取得部
12 テキストデータ出力部
13 観点単語抽出部
14 質問生成部
15 出力部
101 CPU
102 メモリ
103 バス
104 記憶装置
105 プログラム
106 入力装置
107 ディスプレイ
108 通信デバイス
30 通信回線網
40 データベース
50 端末