python高手养成百家号_离骚是词吗 使用Python分析屈原《离骚》中高频词并生成词...,电影,船舶买卖,中国船舶交易网,搜船论坛...

本文主要是介绍python高手养成百家号_离骚是词吗 使用Python分析屈原《离骚》中高频词并生成词...,电影,船舶买卖,中国船舶交易网,搜船论坛...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2 c2 J" `4 f' [; c

【第一步】获取《离骚》原文并对原文数据进行清洗【第二步】对《离骚》原文进行分词统计【第三步】对《离骚》中多频词出现次数进行词云展示【第四步】简要分析词云结果现在我们分步骤逐个击破……

' Z2 S  y! a- H6 _) Q: K/ J

【第一步】获取《离骚》原文并对原文数据进行清洗

" F6 v& j: ?' i5 q

将《离骚》文章及翻译内容下载后保存到本地,文件名为filename。

2 Y1 `  i3 A7 _) m2 t0 J/ R% ^

content_lst = []try:with open(filename, 'r') as f_r:        for item in f_r.readlines():            content_lst.append(item.split('(')[0].strip())except FileExistsError as error:    print(str(error))1 R$ r& j, j5 X3 t7 K! u. m" p# l

将文件去除翻译及换行符后保存在本地(为了说明留下这一步,程序中不用保存在本地)。

& S8 |* K0 ^: b# t) |

try:with open('lisao_clean.txt', 'w') as f_w:        f_w.write(''.join(content_lst))except Exception as e:    print(str(e))7 i! R: ]) A6 ^' i

程序函数中直接返回数据即可。' `+ @. X% }4 ]

none.gif

离骚是词吗 使用Python分析屈原《离骚》中高频词并生成词...-2.jpg (243.62 KB, 下载次数: 0)

2019-6-4 12:14 上传

* Z; |6 j- x) W对《离骚》原文及翻译进行处理

% a+ o* Y8 C: @7 X) A+ P3 Y+ h5 i

【第二步】对《离骚》原文进行分词统计+ a/ P1 K- Y5 E6 p) m* v/ p

首先,将文本中标点符号去除,代码如下:

. {  b, R: n3 V9 E1 |2 T1 I

pattern = re.compile(r',|:|;|,|。|\?|?|!|「|、|《|》|!')re.sub(pattern, '', content)5 O( R$ R3 w& K  o7 k# a5 c

然后利用jieba库进行分词操作,并使用collections库中的Counter()方法返回每个词语的词频信息。( k# m0 Y, ^4 R! |% ?  n

jb_cut = jieba.cut(content)collections.Counter(list(jb_cut)

6 M1 d" U# f. Q3 B' L% G& T: ]

【第三步】对《离骚》中多频词出现次数进行词云展示* N9 l9 ~: ^. q. J

使用词云展示词频信息- t$ y7 Y7 ?" R' ^5 a; U3 m( x

path_image = 'bg.jpg'font_path = "STHUPO.TTF"background_image = np.array(Image.open(path_image))wd = WordCloud(width=1024,    height=800,    max_font_size=500,    random_state=10,    font_path=font_path,    background_color="white",    mask=background_image).generate_from_frequencies(d_content)wd.to_file('lisao.png')plt.imshow(wd, interpolation="bilinear")plt.axis("off")plt.show()- w0 i' F2 G1 v+ R% |

【第四步】简要分析词云结果

, U9 }( K+ x/ l: w+ F! m

程序运行后词云结果如图所示。( X$ K. r# f, `) o

none.gif

离骚是词吗 使用Python分析屈原《离骚》中高频词并生成词...-3.jpg (111.88 KB, 下载次数: 0)

2019-6-4 12:14 上传+ w+ b- u$ ?! l! D$ Q5 Z

《离骚》词云图3 T2 R  K* r9 e4 h

这篇关于python高手养成百家号_离骚是词吗 使用Python分析屈原《离骚》中高频词并生成词...,电影,船舶买卖,中国船舶交易网,搜船论坛...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/373412

相关文章

鸿蒙中@State的原理使用详解(HarmonyOS 5)

《鸿蒙中@State的原理使用详解(HarmonyOS5)》@State是HarmonyOSArkTS框架中用于管理组件状态的核心装饰器,其核心作用是实现数据驱动UI的响应式编程模式,本文给大家介绍... 目录一、@State在鸿蒙中是做什么的?二、@Spythontate的基本原理1. 依赖关系的收集2.

Python基础语法中defaultdict的使用小结

《Python基础语法中defaultdict的使用小结》Python的defaultdict是collections模块中提供的一种特殊的字典类型,它与普通的字典(dict)有着相似的功能,本文主要... 目录示例1示例2python的defaultdict是collections模块中提供的一种特殊的字

利用Python快速搭建Markdown笔记发布系统

《利用Python快速搭建Markdown笔记发布系统》这篇文章主要为大家详细介绍了使用Python生态的成熟工具,在30分钟内搭建一个支持Markdown渲染、分类标签、全文搜索的私有化知识发布系统... 目录引言:为什么要自建知识博客一、技术选型:极简主义开发栈二、系统架构设计三、核心代码实现(分步解析

基于Python实现高效PPT转图片工具

《基于Python实现高效PPT转图片工具》在日常工作中,PPT是我们常用的演示工具,但有时候我们需要将PPT的内容提取为图片格式以便于展示或保存,所以本文将用Python实现PPT转PNG工具,希望... 目录1. 概述2. 功能使用2.1 安装依赖2.2 使用步骤2.3 代码实现2.4 GUI界面3.效

Python获取C++中返回的char*字段的两种思路

《Python获取C++中返回的char*字段的两种思路》有时候需要获取C++函数中返回来的不定长的char*字符串,本文小编为大家找到了两种解决问题的思路,感兴趣的小伙伴可以跟随小编一起学习一下... 有时候需要获取C++函数中返回来的不定长的char*字符串,目前我找到两种解决问题的思路,具体实现如下:

C++ Sort函数使用场景分析

《C++Sort函数使用场景分析》sort函数是algorithm库下的一个函数,sort函数是不稳定的,即大小相同的元素在排序后相对顺序可能发生改变,如果某些场景需要保持相同元素间的相对顺序,可使... 目录C++ Sort函数详解一、sort函数调用的两种方式二、sort函数使用场景三、sort函数排序

python连接本地SQL server详细图文教程

《python连接本地SQLserver详细图文教程》在数据分析领域,经常需要从数据库中获取数据进行分析和处理,下面:本文主要介绍python连接本地SQLserver的相关资料,文中通过代码... 目录一.设置本地账号1.新建用户2.开启双重验证3,开启TCP/IP本地服务二js.python连接实例1.

基于Python和MoviePy实现照片管理和视频合成工具

《基于Python和MoviePy实现照片管理和视频合成工具》在这篇博客中,我们将详细剖析一个基于Python的图形界面应用程序,该程序使用wxPython构建用户界面,并结合MoviePy、Pill... 目录引言项目概述代码结构分析1. 导入和依赖2. 主类:PhotoManager初始化方法:__in

Python从零打造高安全密码管理器

《Python从零打造高安全密码管理器》在数字化时代,每人平均需要管理近百个账号密码,本文将带大家深入剖析一个基于Python的高安全性密码管理器实现方案,感兴趣的小伙伴可以参考一下... 目录一、前言:为什么我们需要专属密码管理器二、系统架构设计2.1 安全加密体系2.2 密码强度策略三、核心功能实现详解

Java String字符串的常用使用方法

《JavaString字符串的常用使用方法》String是JDK提供的一个类,是引用类型,并不是基本的数据类型,String用于字符串操作,在之前学习c语言的时候,对于一些字符串,会初始化字符数组表... 目录一、什么是String二、如何定义一个String1. 用双引号定义2. 通过构造函数定义三、St