成语大全网 - 汉语词典 - python统计歌词中有哪些单词

python统计歌词中有哪些单词

1、首先定义一个函数getText(),能够对独立的文本进行归一处理,将所有的英文字符统一变为小写,所有的符号变为空格然后我们用一个字典对所有的单词,以及出现的次数进行了映射对应。

2、其次将字典类型转换为列表类型,通过排序获得当前最高的单词出现次数,用forin对前五位单词出现次数的元素以及它的次数进行打印;待进行词频统计的文本一定要保存在所安装python文件夹中,否则读取文本的时候就会报错。

3、最后引入jieba库,jieba库中的分词不考虑标点符号,以及大小写问题,只需要将分词结果及对应的数值存放在字典中,用大括号创建一个字典,遍历所有分词结果组成的列表,排除要一个字的分词,其余的做统计储存在字典中。将字典中键值对转换为列表类型,对列表进行排序并输出排名前十五的值。