北京大学计算语言学研究所已经完成了一个有2700万汉字的现代汉语语料库的基本加工。加工项目除词语切分和词性标注外,还包括专有名词(人名、地名、团体机构名称等)标注、语素子类标注以及动词、形容词的特殊用法标注。详情请查阅《北京大学现代汉语语料库基本加工规范》,它的出台是为了更广泛地向专家、同行征询意见,以便进一步修订。