Python:使用nltk统计词频并绘制统计图

简介: Python:使用nltk统计词频并绘制统计图

测试环境:

mac

python3.6.5

安装

pip install nltk

代码示例

# -*- coding: utf-8 -*-


from nltk import FreqDist
from matplotlib import rcParams

# matplotlib 设置中文字体
rcParams["font.family"] = "STHeiti"
rcParams["font.size"] = 8


words = ["你好", "你好", "我好", "我还有"]

freq = FreqDist(words)
print(freq.most_common(1)) # [('你好', 2)]
print(freq.freq("你好")) # 频率 0.5
print(freq["你好"]) # 次数 2

freq.tabulate() # 频率分布表

freq.plot() # 频率分布图

d21.1.png

            </div>
目录
相关文章
|
Java 测试技术 开发者
springboot学习四:Spring Boot profile多环境配置、devtools热部署
这篇文章主要介绍了如何在Spring Boot中进行多环境配置以及如何整合DevTools实现热部署,以提高开发效率。
850 2
|
自然语言处理 供应链 Cloud Native
天源迪科与阿里云发布联合解决方案,基于阿里云原生产品打造卓越的数字化采购平台
随着云上时代日益蓬勃,云原生成为企业精益实践的最好“扶手”,助力企业在公有云、私有云和混合云等新型动态环境中,构建和运行可弹性扩展的应用。
3547 98
天源迪科与阿里云发布联合解决方案,基于阿里云原生产品打造卓越的数字化采购平台
|
机器学习/深度学习 算法 大数据
利用机器学习优化数据中心的能效
【2月更文挑战第20天】 在本文中,我们探索了一种基于机器学习的方法,旨在提高数据中心的能效。数据中心作为现代信息社会的核心设施之一,其能源消耗一直是业界关注的焦点。传统的节能方法依赖于静态阈值和简单规则,难以应对动态变化的负载需求。本研究提出了一种自适应的机器学习框架,能够根据实时数据动态调整资源分配策略。通过分析历史能耗数据和服务器负载特征,模型能够预测未来的负载趋势,并制定相应的节能策略。实验结果表明,该方法在保证服务质量的前提下,可以有效降低能耗,提升数据中心的能效表现。
|
存储 运维 JavaScript
云HIS是什么?HIS系统为什么要上云?云HIS有哪些优点?
云HIS的主要功能作用是提供四个面向的服务,即面向居民的健康服务、面向医疗机构的医疗服务、面向各级管理机关的卫生管理服务、面向其它卫生机构的卫生协同服务。
1116 1
|
监控 网络协议 Shell
网络安全-反弹shell详解(攻击,检测与防御)
网络安全-反弹shell详解(攻击,检测与防御)
1424 0
网络安全-反弹shell详解(攻击,检测与防御)
|
8天前
|
数据采集 人工智能 安全
|
17天前
|
云安全 监控 安全