Python怎样进行词频统计
2023-06-13 09:15:02 时间
词频统计就是输入一段句子或者一篇文章,然后统计句子中每个单词出现的次数。那在python中怎样怎样统计词频出现的次数呢? 之前学习过python字典的使用方法:
字典的get()函数
字典的get()函数返回指定键对应的值。 get()函数使用格式
字典名.get(key) //字典中存在键key 返回键对应的值 字典名.get(key, value) //字典中不存在键key 返回设定的值value
py
info = {'苹果':1, '梨':2}
a = info.get('苹果')
print(a)
输出
1
py
info = {'苹果':1, '梨':2}
a = info.get('草莓',3)
print(a)
输出
3
‘草莓’不是字典info中的键,则get()函数返回,第2个参数设定的值,即3。
词频统计
词频
使用字典存储词语: 词频 这一组数据。 遍历存储词语的列表,如果词语在字典中,就在之前出现的次数上增加1。否则,就把词语添加到字典中。
py
counts = {}
for w in words:
if w in counts: //如果w在字典counts中
counts[w] = counts[w] + 1 //在之前的次数加1
else:
counts[w] = 1 //把词语添加到字典中,并计数1次
print(counts)
words是存储被统计的词语列表。 counts是用于存储统计结果的字典,键是词语,值是词频。
词频统计的简化
使用字典的get()函数,当w键不存在时,返回设定的值0,存在时返回w键对应的值。
py
counts = {}
for w in words:
c= counts.get(w,0) //w不在counts中,返回0; 存在,返回w对应的值。
counts[w] = c + 1
print(counts)
字典中的最大值
遍历字典,判断键对应的值和m的大小,如果值比m大,就让m等于当前值,循环结束,m存储的就是字典的最大值了。
py
m = 0
k = 0
for c in counts:
if counts[c] > m:
m = counts[c]
k = c
print(k, counts[k])
求字典的最大值和列表的最大值的思路是一样的,都是循环比较。 不过字典遍历的是键,需要由键访问值再进行比较。
相关文章
- python识别文字位置_如何利用Python识别图片中的文字
- 哪些软件是python编写出来的_用Python编程需要什么软件?
- Python入门系列(十一)一篇搞定python操作MySQL数据库
- Python机器学习笔记:不得不了解的机器学习面试知识点(1)[通俗易懂]
- 【说站】python中类对象的介绍
- 【说站】Python+OpenCV实现图像识别替换功能详解
- Python win32api_python api文档
- 正则表达式Python_python正则表达式匹配字符串
- 【源码】10 个 Python 爬虫入门实例!
- 统计系列(四)利用Python进行假设检验
- python 手动异常
- Python bool布尔类型
- Redis分布式锁python-redis-lock使用方法
- Python SMTP 发送纯文本详解编程语言
- Python学习:1.快速搭建python环境详解编程语言
- 使用Python连接SQL Server数据库(python连接sqlserver数据库)
- Linux查看Python安装路径的方法(linux查看python安装路径)
- 使用Python连接MySQL数据库,实现高效数据交互(python连接mysql)
- 革命性技术:Python与MSSQL的携手合作(python和mssql)
- python中关于时间和日期函数的常用计算总结(time和datatime)
- videocapture库制作python视频高速传输程序
- python实现随机密码字典生成器示例
- Python实现的一个自动售饮料程序代码分享
- python实现斐波那契递归函数的方法
- python求众数问题实例