Skip to content

yuanjie-ai/stopwords-zh

Repository files navigation

image image image

🔥stopwords-zh🔥


欢迎提交更新,共建中文停用词库

Install

pip install -U stopwords-zh

Usages

  • source: string, 停用词来源,目前支持
    • baidu: 百度停用词表
    • hit: 哈工大停用词表
    • ict: 中科院计算所停用词表
    • scu: 四川大学机器智能实验室停用词库
    • cn: 广为流传未知来源的中文停用词表
    • marimo: Marimo multi-lingual stopwords collection 内的中文停用词
    • iso: Stopwords ISO 内的中文停用词
    • all: 上述所有停用词并集
    • en:nltk中的英文停用词
import jieba
from stopwords import stopwords, filter_stopwords

print(filter_stopwords(jieba.cut('欢迎提交更新,共建中文停用词库')))

TODO

  • 停用词
  • 情感字典

About

中文停用词汇总,持续完善中,欢迎push共建

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published