「ボキャ貧」度を調査する手法をNTTが開発したそうだ。これも、asahi.c
omに掲載されていたものだ。たった50の言葉で判断するそうだ。面白いので、ニ
ュースの切り抜きとして紹介しておこう。
----------------------------------------------------------------------------
「ボキャ貧」度を50語でチェック NTT研が開発
50個の単語をチェックすることで自分が知ってい
る単語の数を推し量る方法をNTTコミュニケーション
科学基礎研究所の天野成昭主任研究員らがつくっ
た。日本語の特性を調べるために構築したデータベ
ースを利用している。
自分が知っている単語数を知るのに辞書で1つず
つ調べると、膨大な時間がかかる。無作為に選べば
大まかな推測はできるが、精度を高めるにはある程
度の数が必要だ。天野さんらは、個々の単語がどの
程度知られているかという親密度を分類したデータ
ベースを使うことで50個の単語で推定ができるよう
にした。
この方法では、親密度が高い単語から低いものを
一定間隔ごとに選び出し、どの段階まで知っている
かの境界を導き出すことで、語い数を推定する。た
だ、固有名詞などデータベースに収録されていない
単語があるため、上限は7万語だ。
データベースづくりのための単語の親密度調査で
は、40人の被験者に、辞書1冊分の8万語を「文字
を見た場合」「発音を聞いた場合」「文字と発音の両
方の場合」で、それぞれ7段階に分類してもらった。
このデータベースは、すでに高齢化や失語症によ
る言語能力低下の検査やリハビリなどの医療分野、
補聴器の性能測定への応用研究が始まっていると
いう。同研究所の近藤公久主任研究員は「電子情
報なので自由に加工できる。言語、音声に関連する
分野で幅広い利用が期待できる」と話している。
インターネットで語い数推定テストを見る場合のア
ドレスは、
http://www.brl.ntt.co.jp/cs/human/goi/goi-test.html
★語彙数推定テスト
1 チャンピオン
2 祝日
3 爆発
4 ライン
5 さつま芋
6 毒ガス
7 枝豆
8 過ごす
9 朝風呂
10 そもそも
11 見極める
12 香ばしい
13 本題
14 エンゲル係数
15 泊まり込む
16 預け入れる
17 言い直す
18 たしなみ
19 英文学
20 はまり役
21 ごろ合わせ
22 労力
23 忍ばせる
24 勃発
25 宿無し
26 目白押し
27 請負い
28 塗り箸
29 気丈さ
30 茶番
31 大腿骨
32 術中
33 泌尿器
34 血税
35 悶着
36 腰元
37 裾模様
38 旗竿
39 かんじき
40 すっこむ
41 迂曲
42 告諭
43 辻番
44 ライニング
45 輪タク
46 懸軍
47 陣鐘
48 泥濘
49 釜がえり
50 頑冥不霊
*
単純に、1から連続して10までが知っている単語
で11以降をすべて知らなかった場合は、推定語い
数は8800語。同様に15までなら1万3000語、20
までなら1万8000語、25までは2万3000語、30
までは3万語、35までは3万9000語、40までは5
万語、45までは6万語、50までは7万語。途中で知
らない単語が交ざった場合は結果の算出は複雑に
なる。(14:50)