博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
文件方式实现完整的英文词频统计实例
阅读量:4984 次
发布时间:2019-06-12

本文共 668 字,大约阅读时间需要 2 分钟。

可以下载一长篇的英文小说,进行词频的分析。

1.读入待分析的字符串

2.分解提取单词 

3.计数字典

4.排除语法型词汇

5.排序

6.输出TOP(20)

7.对输出结果的简要说明。

str=open('F:\\wanghao.txt','r')#读入待分析的字符串str=str.read()#将所有大写转换为小写str=str.lower()#将所有将所有其他做分隔符(,.?!)替换为空格for i in ',.?!:':    str=str.replace(i,' ')#分隔出一个一个单词str=str.split(' ')#排除语法型词汇exp={
'is','and','that','it','a','our','have','','the','for','of','as','on','be','will','we','can','with','all','more','be','in','to','this','an','own','how','at','are','one'}word=set(str)-exp#计数字典 dic={}for i in word: dic[i]=str.count(i)str=list(dic.items())#排序str.sort(key=lambda x:x[1],reverse=True)for i in range(10): print(str[i])

转载于:https://www.cnblogs.com/marsk/p/7604086.html

你可能感兴趣的文章
dataTable/dataSet转换成Json格式
查看>>
asp.net core模块学习
查看>>
MySQL远程连接不上的解决方法
查看>>
如何使用JMeter从文件中提取数据
查看>>
AndroidBase基础类文档
查看>>
使用delphi 开发多层应用(十九) ios通过soap 访问kbmmw服务器
查看>>
三大特征 封装 继承 多态
查看>>
Python 3 函数分类
查看>>
通过.frm表结构和.ibd文件恢复数据
查看>>
R语言之——字符串处理函数
查看>>
架构师速成5.1-小学gtd进阶
查看>>
Spring-aop(一)
查看>>
ucos在xp平台下开发环境搭建
查看>>
python基础入门while循环 格式化 编码初识
查看>>
cmake方式使用vlfeat
查看>>
windows下用纯C实现一个简陋的imshow:基于GDI
查看>>
struts2 自定义类型转换器
查看>>
cocos2d-x xna在有vs2012和vs2010的情况下的环境部署
查看>>
43-安装 Docker Machine
查看>>
c++学习(三):表达式和语句
查看>>