开发者社区> 问答> 正文

什么是结巴分词?

什么是结巴分词?

展开
收起
鲁花花生油 2021-11-03 14:50:43 1837 0
来自:华章出版社
1 条回答
写回答
取消 提交回答
  • 由于NLTK本身不支持中文分词,因此在针对中文的处理过程中,我们会引入其他分词工具,例如结巴分词。结巴分词是国内的Python文本处理工具包,分词模式分为3种模式:精确模式、全模式和搜索引擎模式,支持繁体分词、自定义词典等,是非常好的Python中文分词解决方案,可以实现分词、词典管理、关键字抽取、词性标注等。结巴分词默认不在Anaconda的安装包中,读者可在Jupyter中直接使用!pip install jieba命令安装即可。安装成功之后,使用import jieba导入。

    资料来源:《Python数据分析与数据化运营(第2版)》,文章链接:https://developer.aliyun.com/article/726313

    2021-11-03 15:01:51
    赞同 展开评论 打赏
问答分类:
问答地址:
来源圈子
更多
收录在圈子:
+ 订阅
问答排行榜
最热
最新

相关电子书

更多
中文:即学即用的Pandas入门与时间序列分析 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载