结巴分词获取关键词时怎么过滤掉一些停用词

2025-03-07 01:45:12
推荐回答(1个)
回答1:

是使用extract_tags函数,这个函数会根据TF-IDF算法将特征词提取出来,在提取之前会去掉停用词,可以人工指定停用词字典,代码如下:

jieba.analyse.set_stop_words('D:\\Python27\\stopword.txt')
tags = jieba.analyse.extract_tags(text,20)