文件方式实现完整的英文词频统计实例-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

文件方式实现完整的英文词频统计实例

阅读量：4984 次

发布时间：2019-06-12

本文共 668 字，大约阅读时间需要 2 分钟。

可以下载一长篇的英文小说，进行词频的分析。

1.读入待分析的字符串

2.分解提取单词

3.计数字典

4.排除语法型词汇

5.排序

6.输出TOP(20)

7.对输出结果的简要说明。

str=open('F:\\wanghao.txt','r')#读入待分析的字符串str=str.read()#将所有大写转换为小写str=str.lower()#将所有将所有其他做分隔符（,.？！）替换为空格for i in ',.?!:':    str=str.replace(i,' ')#分隔出一个一个单词str=str.split(' ')#排除语法型词汇exp={
   'is','and','that','it','a','our','have','','the','for','of','as','on','be','will','we','can','with','all','more','be','in','to','this','an','own','how','at','are','one'}word=set(str)-exp#计数字典 dic={}for i in word:    dic[i]=str.count(i)str=list(dic.items())#排序str.sort(key=lambda x:x[1],reverse=True)for i in range(10):    print(str[i])

转载于:https://www.cnblogs.com/marsk/p/7604086.html

你可能感兴趣的文章

dataTable/dataSet转换成Json格式

asp.net core模块学习

MySQL远程连接不上的解决方法

如何使用JMeter从文件中提取数据

AndroidBase基础类文档

使用delphi 开发多层应用（十九) ios通过soap 访问kbmmw服务器

三大特征封装继承多态

Python 3 函数分类

通过.frm表结构和.ibd文件恢复数据

R语言之——字符串处理函数

架构师速成5.1-小学gtd进阶

Spring-aop(一)

ucos在xp平台下开发环境搭建

python基础入门while循环格式化编码初识

cmake方式使用vlfeat

windows下用纯C实现一个简陋的imshow：基于GDI

struts2 自定义类型转换器

cocos2d-x xna在有vs2012和vs2010的情况下的环境部署

43-安装 Docker Machine

c++学习(三)：表达式和语句

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-11-09 03:59:26 当前IP: 3.135.216.29 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我