登录    |    注册

语料库

2020-09-09 14:22:12

(Corpus,复数为Corpora或Corpuses)定义为:为语言研究和应用而收集的,在计算机中存储的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。语料库具有以下三个基本特征:样本代表性;规模有限性;机读形式化。