本文主要是介绍python高手养成百家号_离骚是词吗 使用Python分析屈原《离骚》中高频词并生成词...,电影,船舶买卖,中国船舶交易网,搜船论坛...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
2 c2 J" `4 f' [; c
【第一步】获取《离骚》原文并对原文数据进行清洗【第二步】对《离骚》原文进行分词统计【第三步】对《离骚》中多频词出现次数进行词云展示【第四步】简要分析词云结果现在我们分步骤逐个击破……
' Z2 S y! a- H6 _) Q: K/ J
【第一步】获取《离骚》原文并对原文数据进行清洗
" F6 v& j: ?' i5 q
将《离骚》文章及翻译内容下载后保存到本地,文件名为filename。
2 Y1 ` i3 A7 _) m2 t0 J/ R% ^
content_lst = []try:with open(filename, 'r') as f_r: for item in f_r.readlines(): content_lst.append(item.split('(')[0].strip())except FileExistsError as error: print(str(error))1 R$ r& j, j5 X3 t7 K! u. m" p# l
将文件去除翻译及换行符后保存在本地(为了说明留下这一步,程序中不用保存在本地)。
& S8 |* K0 ^: b# t) |
try:with open('lisao_clean.txt', 'w') as f_w: f_w.write(''.join(content_lst))except Exception as e: print(str(e))7 i! R: ]) A6 ^' i
程序函数中直接返回数据即可。' `+ @. X% }4 ]
离骚是词吗 使用Python分析屈原《离骚》中高频词并生成词...-2.jpg (243.62 KB, 下载次数: 0)
2019-6-4 12:14 上传
* Z; |6 j- x) W对《离骚》原文及翻译进行处理
% a+ o* Y8 C: @7 X) A+ P3 Y+ h5 i
【第二步】对《离骚》原文进行分词统计+ a/ P1 K- Y5 E6 p) m* v/ p
首先,将文本中标点符号去除,代码如下:
. { b, R: n3 V9 E1 |2 T1 I
pattern = re.compile(r',|:|;|,|。|\?|?|!|「|、|《|》|!')re.sub(pattern, '', content)5 O( R$ R3 w& K o7 k# a5 c
然后利用jieba库进行分词操作,并使用collections库中的Counter()方法返回每个词语的词频信息。( k# m0 Y, ^4 R! |% ? n
jb_cut = jieba.cut(content)collections.Counter(list(jb_cut)
6 M1 d" U# f. Q3 B' L% G& T: ]
【第三步】对《离骚》中多频词出现次数进行词云展示* N9 l9 ~: ^. q. J
使用词云展示词频信息- t$ y7 Y7 ?" R' ^5 a; U3 m( x
path_image = 'bg.jpg'font_path = "STHUPO.TTF"background_image = np.array(Image.open(path_image))wd = WordCloud(width=1024, height=800, max_font_size=500, random_state=10, font_path=font_path, background_color="white", mask=background_image).generate_from_frequencies(d_content)wd.to_file('lisao.png')plt.imshow(wd, interpolation="bilinear")plt.axis("off")plt.show()- w0 i' F2 G1 v+ R% |
【第四步】简要分析词云结果
, U9 }( K+ x/ l: w+ F! m
程序运行后词云结果如图所示。( X$ K. r# f, `) o
离骚是词吗 使用Python分析屈原《离骚》中高频词并生成词...-3.jpg (111.88 KB, 下载次数: 0)
2019-6-4 12:14 上传+ w+ b- u$ ?! l! D$ Q5 Z
《离骚》词云图3 T2 R K* r9 e4 h
这篇关于python高手养成百家号_离骚是词吗 使用Python分析屈原《离骚》中高频词并生成词...,电影,船舶买卖,中国船舶交易网,搜船论坛...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!