(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022087151
(43)【公開日】2022-06-09
(54)【発明の名称】語彙発達指標推定装置、語彙発達指標推定方法、プログラム
(51)【国際特許分類】
G09B 19/00 20060101AFI20220602BHJP
G06F 16/335 20190101ALI20220602BHJP
G16H 50/20 20180101ALI20220602BHJP
【FI】
G09B19/00 H
G06F16/335
G16H50/20
【審査請求】有
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2022055338
(22)【出願日】2022-03-30
(62)【分割の表示】P 2019006697の分割
【原出願日】2019-01-18
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (1)発行日 平成30年1月19日 刊行物 電子情報通信学会技術研究報告 信学技報 IEICE Technical Report Vol.117 No.420 ISSN 0913-5685 65頁~68頁 (2)ウェブサイト掲載日 2018年5月3日 ウェブサイトのアドレス LREC2018(http://lrec2018.lrec-conf.org/en/) (3)ウェブサイト掲載日 平成30年5月31日 ウェブサイトのアドレス 日本電信電話株式会社 NTTコミュニケーション科学基礎研究所 オープンハウス2018 http://www.kecl.ntt.co.jp/openhouse/2018/ (4)ウェブサイト掲載日 平成30年11月26日 ウェブサイトのアドレス NTT R&Dフォーラム2018秋 https://labevent.ecl.ntt.co.jp/forum2018a/info/index.html
(71)【出願人】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(71)【出願人】
【識別番号】504133110
【氏名又は名称】国立大学法人電気通信大学
(74)【代理人】
【識別番号】100121706
【弁理士】
【氏名又は名称】中尾 直樹
(74)【代理人】
【識別番号】100128705
【弁理士】
【氏名又は名称】中村 幸雄
(74)【代理人】
【識別番号】100147773
【弁理士】
【氏名又は名称】義村 宗洋
(72)【発明者】
【氏名】小林 哲生
(72)【発明者】
【氏名】南 泰浩
(57)【要約】
【課題】習得期間の長さに依らず、次獲得単語を推定することができる語彙発達指標推定装置を提供する。
【解決手段】対象者が獲得した単語の集合を取得して、その要素の数である単語数N(Nは0以上の整数)をカウントする語数カウント部と、予め定めた単語のそれぞれにX%獲得齢(Xは予め定めた正の数)を対応付けて記憶するAoA記憶部と、予め定めた単語をX%獲得齢の小さいものから順にL個取得し(Lは正の整数)、取得したL個の単語のうち、対象者が獲得したN個の単語を除外して、残りの単語を次獲得単語と推定する次獲得単語推定部を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
対象者が獲得した単語の集合を取得して、その要素の数である単語数N(Nは0以上の整数)をカウントする語数カウント部と、
予め定めた単語のそれぞれにX%獲得齢(Xは予め定めた正の数)を対応付けて記憶するAoA記憶部と、
前記予め定めた単語をX%獲得齢の小さいものから順にL個取得し(Lは正の整数)、取得したL個の単語のうち、対象者が獲得したN個の単語を除外して、残りの単語を次獲得単語と推定する次獲得単語推定部を含む
語彙発達指標推定装置。
【請求項2】
請求項1に記載の語彙発達指標推定装置であって、
推定された次獲得単語を呈示する次獲得単語呈示部を含み、
前記次獲得単語呈示部は、
前記予め定めた単語をX%獲得齢の小さいものから順にN個取得した集合に含まれる単語を優先して呈示する
語彙発達指標推定装置。
【請求項3】
対象者が獲得した単語の集合を取得して、その要素の数である単語数N(Nは0以上の整数)をカウントする語数カウントステップと、
予め定めた単語のそれぞれにX%獲得齢(Xは予め定めた正の数)を対応付けて記憶するAoA記憶ステップと、
前記予め定めた単語をX%獲得齢の小さいものから順にL個取得し(Lは正の整数)、取得したL個の単語のうち、対象者が獲得したN個の単語を除外して、残りの単語を次獲得単語と推定する次獲得単語推定ステップと、
推定された次獲得単語を呈示する次獲得単語呈示ステップを含む
語彙発達指標推定方法。
【請求項4】
コンピュータを、請求項1または2に記載の語彙発達指標推定装置として機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、語彙発達指標を推定する語彙発達指標推定装置、語彙発達指標推定方法、プログラムに関する。
【背景技術】
【0002】
幼児がいつ、どんな語を習得するかを明らかにすることは、言語発達の分野における重要な研究テーマの1つである。幼児の語彙発達データを取得する手法の1つに語彙チェックリスト法(vocabulary checklist method)がある。これは、あらかじめ用意された有限個の語彙からなるチェックリストを用いて、子供が理解/発話できる語を養育者が報告する手法である。すなわち、チェックリストの各語彙について、評価対象者である子供が、評価時の月齢において理解/発話できるか否かを、利用者である養育者が報告する手法である。
【0003】
従来、発達心理学の分野では、上記のような養育者である親の回答に基づくアンケート調査において語彙チェックリストを用いた大規模集団データで語彙の特徴を捉えてきた。この手法でWeb上で日誌方式(以下、Web日誌法)で日本全国からデータ収集する試みにより、非特許文献2に示すように語彙チェックリスト法の横断データから算出した各語彙の「50%到達日齢」(50%の子供が語彙を理解している日齢時点。心理学ではAoA[age of acquisition])がいつかを調べ、それを語彙の理解日齢としていた。
【0004】
幼児の語彙発達はこうした手法によって集められたデータに基づいて、対象とする幼児と同月齢の幼児が獲得している語彙や語彙数と、対象とする幼児が獲得している語彙や語彙数とを比較する等により評価できる。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】小椋たみ子、綿巻徹、「日本のこどもの語彙発達の基準研究:日本語マッカーサー乳幼児言語発達質問紙から」発達・療育研 2008. vol.24,3-42.
【非特許文献2】小林哲生、南泰浩、永田昌明、「縦断および横断データを用いた幼児早期現語の獲得日齢の特定」言語処理学会第18回年次大会、P2-3,2012.
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、幼児の語彙発達は個人差が大きい。また、自閉症児や発達障がいをもつ幼児は言語の獲得速度が緩やかであることが知られており、習得期間の長さのみから語彙の発達状況を推測することは困難である。
【0007】
そこで本発明は、習得期間の長さに依らず、次獲得単語を推定することができる語彙発達指標推定装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の語彙発達指標推定装置は、語数カウント部と、AoA記憶部と、次獲得単語推定部を含む。
【0009】
語数カウント部は、対象者が獲得した単語の集合を取得して、その要素の数である単語数N(Nは0以上の整数)をカウントする。AoA記憶部は、予め定めた単語のそれぞれにX%獲得齢(Xは予め定めた正の数)を対応付けて記憶する。次獲得単語推定部は、予め定めた単語をX%獲得齢の小さいものから順にL個取得し(Lは正の整数)、取得したL個の単語のうち、対象者が獲得したN個の単語を除外して、残りの単語を次獲得単語と推定する。
【発明の効果】
【0010】
本発明の語彙発達指標推定装置によれば、習得期間の長さに依らず、次獲得単語を推定することができる。
【図面の簡単な説明】
【0011】
【
図1】実施例1の語彙発達指標推定装置の構成を示すブロック図。
【
図2】実施例1の語彙発達指標推定装置の動作を示すフローチャート。
【
図3】実施例2の語彙発達指標推定装置の構成を示すブロック図。
【
図4】実施例2の語彙発達指標推定装置の動作を示すフローチャート。
【
図5】実施例3の語彙発達指標推定装置の構成を示すブロック図。
【
図6】実施例3の語彙発達指標推定装置の動作を示すフローチャート。
【
図7】実施例4の語彙発達指標推定装置の構成を示すブロック図。
【
図8】実施例4の語彙発達指標推定装置の動作を示すフローチャート。
【
図9】横軸を獲得語彙数、縦軸を共通ボキャブラリー指数とした散布図(対面調査の場合)。
【
図10】横軸を獲得語彙数、縦軸を共通ボキャブラリー指数とした散布図(web調査の場合)。
【発明を実施するための形態】
【0012】
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
【0013】
<用語の定義:「獲得」>
本明細書において、語彙または単語の「獲得」と表現した場合、対象者がその語彙(単語)を発話できること、対象者がその語彙(単語)を理解できることの双方の概念を含んでいるものとする。語彙発達指標推定装置の実装に当たっては、「獲得」を語彙(単語)の発話に限定してもよいし、語彙(単語)の理解に限定してもよいし、語彙(単語)の発話と理解の双方を含んでもよい。
【0014】
<用語の定義:「X%獲得日齢」、「X%獲得月齢」、「X%獲得年齢」、「X%獲得齢」>
本明細書において、「X%獲得日齢」、「X%獲得月齢」、「X%獲得年齢」という場合、対象者が幼児であれば、該当する語彙(単語)を全体のX%の幼児が獲得する日齢、月齢、年齢を意味する。月齢、年齢を整数とせず、日齢と同程度の精度とする場合、日齢、月齢、年齢のいずれを用いても差異はない。例えば、50%獲得月齢という場合、該当する語彙(単語)を全体のちょうど半分の幼児が獲得する月齢を意味する。また、上述の「X%獲得日齢」、「X%獲得月齢」、「X%獲得年齢」などを一般化した呼称として、「X%獲得齢」を用いる。すなわち、該当する語彙(単語)を全体のX%の対象者が獲得するまでの期間を、日齢、月齢、年齢などに限定せずに一般的に表現する場合には「X%獲得齢」を用いる。以下の実施例ではX%獲得月齢を例に説明を進めるが、本発明はこれに限定されるものではない。
【0015】
<原理>
以下の実施例に記載の語彙発達指標推定装置は、生後8-48ヶ月齢の日本語を母語とする幼児(N=1451)から得られた大規模な語彙データベース、当該データベースに基づいて推定された2688語のAoA(語彙獲得月齢)に基づいて算出した共通ボキャブラリー指数から得られた知見を利用している。例えば、同程度の語彙数(単語数)を獲得している幼児は、同程度の割合の共通語を獲得している傾向がある。語彙数(単語数)が大きくなるにつれ、この傾向は顕著になることが分かっている。この傾向は、人が語彙を獲得する際に共通する傾向であると考えられる。従って、共通ボキャブラリー指数は、対象者の獲得した共通語の特定、対象者全体の傾向と対象者個人の傾向の比較を可能とし、発達変化や個人差を調べるために有益であるといえる。
【実施例0016】
以下、
図1を参照して、実施例1の語彙発達指標推定装置の構成を説明する。同図に示すように、本実施例の語彙発達指標推定装置1は、語数カウント部11と、AoA記憶部12aと、AoA取得部12と、共通ボキャブラリー指数算出部13と、制御部13aと、共通ボキャブラリー指数関数算出部14と、共通ボキャブラリー指数関数記憶部14aを含む構成である。以下、
図2を参照して各部の動作を説明する。
【0017】
<語数カウント部11>
語数カウント部11は、対象者(例えば、養育者が観察している幼児)が獲得した単語(例えば、発話する単語)の集合を取得して、その要素の数である単語数N(Nは0以上の整数)をカウントし、出力する(S11)。
【0018】
対象者、例えば日本語環境で育つ幼児が獲得する単語については、語彙チェックリストなどを利用することができる。(参考非特許文献1:小林哲生、奥村優子、南泰浩、「語彙チェックリストアプリによる幼児語彙発達データ収集の試み」,IEICE Technical Report HCS2015-59(2016-01))
獲得した単語を1語1語入力する方法などを用いてもよい。
【0019】
<AoA記憶部12a>
AoA記憶部12aは、予め定めた単語のそれぞれにX%獲得月齢(Xは予め定めた正の数)を対応付けて(紐づけて)記憶している。
【0020】
予め定めた単語とは、例えば対象者が日本語環境で育つ幼児の場合、日本語環境で育つ幼児が発達初期に覚える可能性のある語彙であり、例えば上述のWeb日誌法で収集されAoAが付与された単語である。
【0021】
AoA記憶部12aに記憶されている単語はすべて、語彙チェックリストに含まれるようにしておくことがのぞましい。
【0022】
例えば対象者が日本語環境で育つ幼児の場合、Xが小さすぎる(例えばX=30)と発達の早い幼児しか対象とならず、大きすぎる(例えば80)と発達の遅い幼児しか対象にならない可能性があるため、対象者が日本語環境で育つ幼児の場合には、X=50程度とするのが好適である。
【0023】
<AoA取得部12>
AoA取得部12は、語数カウント部11から出力される単語数Nを取得し、予め定めた単語をX%獲得月齢の小さいものから順にN個取得して、出力する(S12)。
【0024】
<共通ボキャブラリー指数算出部13>
共通ボキャブラリー指数算出部13は、対象者が獲得した単語の集合と、予め定めた単語をX%獲得月齢の小さいものから順にN個取得した集合を入力とし、対象者が獲得した単語の集合と、予め定めた単語をX%獲得月齢の小さいものから順にN個取得した集合との積集合の要素数をNで除して共通ボキャブラリー指数を算出し、対象者が獲得した単語数Nと共通ボキャブラリー指数を組にして出力する(S13)。共通ボキャブラリー指数(Vocabulary Commonality Index: VocIndex)は、対象者の語彙獲得の発達パタンを解明するために、各対象者が言語発達の初期段階でどの程度共通語を獲得しているかを分析するツールとした(発明者らが定義した)指数である。
【0025】
共通ボキャブラリー指数の定義を式(1)に示す。
VocIndex(i) = | setVoc(i)∩setAoA(N) | / N (1)
【0026】
ここで、setVoc(i)は対象者iが獲得した語彙(単語)の集合、Nは対象者iが獲得した語彙(単語)の数を表す。setAoA(N)は集合setVoc(i)の要素数(=単語数=N)と同じ数の
単語を、AoA推定順位(付与されているX%獲得月齢が小さい順)で並べた単語リストから取ってきた集合である。
【0027】
式(1)の分子は二つの単語集合の共通部分(積集合)の要素数である。つまり、分子は二つの単語集合で共通する単語(共通語)の語数、分母は獲得総語数(対象者iが獲得した語彙数=N)である。そして、この指数VocIndex(i)の取り得る範囲は[0,1]となる。対象者が獲得した語彙(単語)が全て共通語である場合は、共通ボキャブラリー指数は1となる。一方、対象者が獲得した語彙(単語)が全て共通語でなかった場合、共通ボキャブラリー指数は0となる。共通ボキャブラリー指数が大きければ大きいほど、対象者が獲得した語彙が共通語である割合が多いことを示す。
【0028】
対象者が獲得する語彙(単語)の数が増えるにつれ、共通ボキャブラリー指数は大きくなる傾向にある。対象者が獲得した単語の集合を対面式でアンケート調査し、得られた結果に基づいて共通ボキャブラリー指数を求め、横軸を獲得語彙数、縦軸を共通ボキャブラリー指数とした散布図を
図9に示す。なお、
図9のデータは、無作為に選ばれた1446名の幼児のデータであり、言語の遅れのある幼児のデータを含む。対象者が獲得する語彙(単語)の数と、共通ボキャブラリー指数の関係には
図9のような強い関係性がある(
図9中灰色のラインが関係性を示すライン、データはその平均値の上下に極めて小さな範囲で分布する)。同図の散布図の分散が小さいことから、対象者が獲得する語彙(単語)の数と、共通ボキャブラリー指数の関係は対象者の個人差や、発達の遅れによって影響をうけないため、共通ボキャブラリー指数を語彙の発達の指標(語彙数を示唆する指標)として用いることができる。
【0029】
<制御部13a>
制御部13aは、M人(Mは2以上の整数)の対象者のそれぞれが獲得した単語の集合に対する、語数カウント部11とAoA取得部12と共通ボキャブラリー指数算出部13の動作(S11、S12、S13)の繰り返し実行を制御する。
【0030】
Mは、平均値を計算した場合に、当該平均値が信頼できる程度の数とすれば好適である。例えば、M≧200とすれば好適である。対象者M人分のデータには同じ対象者の月齢の異なるデータ(習得期間の異なるデータ)が含まれていてもよい。
【0031】
<共通ボキャブラリー指数関数算出部14>
共通ボキャブラリー指数関数算出部14は、M人の対象者の獲得した単語の数と、M人の対象者の共通ボキャブラリー指数を入力として、獲得単語数(獲得語彙数)を変数として共通ボキャブラリー指数を求める関数(近似式)VI(x)を算出し、出力する(S14)。
【0032】
関数の求め方にはバリエーションがある。例えば、対象者を獲得単語数順に並べ獲得単語数の少ないものから順にx個(例えばx=60)のデータを取り出し、その平均獲得単語数と平均ボキャブラリー指数を求めてプロットする。このプロットをrデータ(rは1以上の整数)づつシフトしながら実行し、移動平均値を求めてもよい。また、ある獲得単語数xの前後の獲得単語数(例えば±20語)の対象者のデータに基づいて、獲得単語数xの移動平均値を求めてもよい。この場合、獲得単語数x+rの前後の獲得単語数(例えば±20語)の対象者のデータに基づいて、獲得単語数x+rの移動平均値を求めることができる。また、例えば、ある獲得単語数xの前後の対象者(例えば±20人)の対象者のデータに基づいて、獲得単語数xの移動平均値を求めてもよい。この場合、獲得単語数x+rの前後の対象者(例えば±20人)のデータに基づいて、獲得単語数x+rの移動平均値を求めることができる。
【0033】
上記の隣り合う移動平均値を直線(1次式)で結ぶことにより、(近似式)VI(x)を求めてもよいし、いくつかの移動平均から回帰式をもとめ、それを複数個接続してもよい。また、これらの移動平均値の全てを用いて、回帰式を求めてもよい。
【0034】
また、移動平均値によらず、獲得単語数(獲得語彙数)と共通ボキャブラリー指数のデータ群から直接回帰式(多項式回帰や一般化線形回帰、非線形回帰)を求めてもよいし、カルマンフィルタや高周波を除去するフィルターなどを利用してもよい。
【0035】
また、上記の方法で、対象者を獲得単語数順に並べ、獲得単語数の少ないものから順にx個(例えばx=60)のデータを取り出し、その平均獲得単語数と平均ボキャブラリー指数およびその分散を求めてプロットし、このプロットを所定の数のデータづつシフトしながら実行し、移動平均値を求め、例えば隣り合う移動平均値を直線(1次式)で結ぶことにより、近似式を求めてもよいし、いくつかの移動平均から回帰式をもとめ、それを複数個接続してもよい。また、これらの移動平均値の全てを用いて、回帰式を求めてもよい。
【0036】
<共通ボキャブラリー指数関数記憶部14a>
共通ボキャブラリー指数関数記憶部14aは、ステップS14で算出した共通ボキャブラリー指数関数VI(x)を入力とし、記憶する。
【0037】
以上が学習フェーズである。学習フェーズは事前に行い、共通ボキャブラリー指数関数VI(x)を共通ボキャブラリー指数関数記憶部14aに予め記憶しておき、利用フェーズにおいて、共通ボキャブラリー指数関数VI(x)を共通ボキャブラリー指数関数記憶部14aから読み出して用いる。
不正入力判定部25は、所定の単語数(ここではJ(Jは0以上の整数)とする)ごとに、獲得した単語の単語数Jを中心とする所定の単語数の範囲内にある対象者間の共通ボキャブラリー指数の平均または平均関数およびその分散または分散関数を求め、共通ボキャブラリー指数の平均または平均関数およびその分散または分散関数に基づいて、獲得した単語の単語数がJである所定の対象者の共通ボキャブラリー指数のうち、外れ値に該当する共通ボキャブラリー指数があると判定される場合に、該当する共通ボキャブラリー指数(または、該当する共通ボキャブラリー指数を算出する元になった所定の対象者が獲得した単語の集合)を不正入力によるものであると判定する(S25)。平均関数は、例えば共通ボキャブラリー指数の移動平均などでよい。また、分散関数は、例えば共通ボキャブラリー指数の分散に所定の係数を乗算したものでよい。あるいは、得られた平均値、分散を関数近似したものをそれぞれ平均関数、分散関数としてもよい。
不正入力判定部25は、「対象者が獲得した単語数と共通ボキャブラリー指数の組」の共通ボキャブラリー指数、または単語の集合が不正入力によるものであると判定されれば0、不正入力によるものでないと判定されれば1というように、判定結果を2値で表し、「対象者が獲得した単語数と共通ボキャブラリー指数と判定結果の組」を出力してもよいし、「対象者が獲得した単語数と共通ボキャブラリー指数の組」の共通ボキャブラリー指数、または単語の集合が、不正入力によるものでないと判定された場合に限り、「対象者が獲得した単語数と共通ボキャブラリー指数の組」を出力するようにしてもよい。
共通ボキャブラリー指数は、単語数50以上では極めて狭い範囲に集中する。不正入力判定部25は、上記の方法で、例えば単語数J±30語の対象者の平均共通ボキャブラリー指数μJを求め、これらの対象者の共通ボキャブラリー指数の分散を求める。この分散をσJとする。不正入力判定部25は、単語数Jの対象者の共通ボキャブラリー指数がμJ±wσJの範囲外であれば、その対象者のデータを不正入力とし、範囲内であれば、その対象者のデータを不正入力ではないと判定する。wは1.5~3程度の値が好ましい。