常用词是在某一个时期经常使用的词。常用词的总汇是常用词汇,其他词构成的集合是非常用词汇。常用词汇和非常用词汇的划分根据词语的使用频率,可以靠词频统计得出。由于词频的高低是渐变的,因此常用词汇和非常用词汇的划分也是相对的,如可以分为最常用词汇、次常用词汇、非常用词汇等。
词频统计依赖一定的语料基础,语料范围不同,结果就会不同。比如可以有口语常用词汇、书面语常用词汇、新闻常用词汇、法律常用词汇等。如果统计的范围足够大,涵盖所有的语言使用领域,就是一种语言的常用词汇。目前还不能完全做到。一般所说的常用词汇还只能是“局域”常用词汇。
统计显示,一种语言最常用的词大概就是那三四千个,对语料的覆盖率却达到85%以上,这就意味着,掌握了它们,就能懂得一般语言材料的85%以上的内容 。现代汉语词汇的计量研究和常用词的提取工作取得了一些成果。词频统计的成果如:《现代汉语频率词典》(北京语言学院语言教学研究所编著,北京语言学院出版社,1986年)统计了180万字的语料,收录不同词语31 159条;《现代汉语常用词表(草案)》(国家语委发布,商务印书馆,2008年)统计了2.5亿字的语料,收录不同词语56 008条。常用词提取的成果如:《普通话三千常用词表(初稿)》(郑林曦等编,文字改革出版社,1959年)收词3 624个,1987年的增订本增加到3 996个;《现代汉语三千常用词表》(何克抗、李大魁主编,北京师范大学出版社,1987年)收词 3 000 个;《汉语水平词汇与汉字等级大纲》(刘英林主编,北京语言学院出版社,1992年)收词8 822个,分为甲、乙、丙、丁四级,甲、乙级词共3 051个,修订本由经济科学出版社于2001年出版。但总起来看,统计的语料范围还不够广泛,数量还不够充足,口语语料所占比例还不高。
常用词汇与基本词汇的角度不同。基本词一定是常用词,但常用词不一定是基本词。如果一个词只在某个领域常用,而不具有普遍性,就不是基本词。如教育行业常用的“预备”、“上课”、“备课”、“口试”、“课件”等就不是基本词。可以认为,基本词是常用词中普遍常用的那一部分。