分词技术:基于统计和基于规则方面的都有。现在基于规则的开始慢慢流行起来了。需要用到很多方法,其实就是算法最重要。分词技术的难点是:消除歧义和新词识别。领域:信息检索,机器翻译(MT)、语音合成、自动分类、自动摘要、自动校对等等,都需要用到分。希望能给您提供帮助。
自然语言理解,翻译,文章比对. 我就用来进行公司名称的比对