本文主要是介绍Pandas——词云图绘制,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
文本处理
-
词频统计 绘制词云图
-
英文词频统计 分词→词形还原(nltk) →去停用词 →统计词频
-
中文词频统计 分词(jieba) →去停用词 → 统计词频
评论文本的分析
-
通过词云图展示出现次数较多的词, 可以发现问题
微博/头条/新闻评论
词云图绘制
可以使用Pyecharts绘制词云
绘制词云图的API
import pyecharts.options as opts from pyecharts.charts import WordCloud
要准备的数据
[(文本, 数值),(文本2,数值2)....]
negtive_words_wordcloud = all_words_n.most_common(100) (WordCloud().add(series_name="好评词云",data_pair=negtive_words_wordcloud, #传入绘制词云图的数据 [[要展示的词, int值],[要展示的词2, int值]]word_size_range=[16, 80]) #word_size_range 字号大小取值范围.set_global_opts(title_opts=opts.TitleOpts(title="好评词云", title_textstyle_opts=opts.TextStyleOpts(font_size=23) # 设置标题字号),tooltip_opts=opts.TooltipOpts(is_show=True), # 设置为True 鼠标滑过文字会弹出提示框).render('neg_wordcloud.html') )
数据分析报告
周报月报
-
先展示大盘的数据, 最主要的指标
-
以图为主
-
使用的图形不要过于复杂
-
折线图, 饼图, 柱状图, 堆积柱状图, 散点图 基本图表为主
-
-
关键的变化, 需要用文字进行说明
-
如果是月报的话, 大盘数据展示后, 各个维度的数据都要展示一下
周报月报一旦做出来了, 框架搭建起来之后, 直接修改数据,和文字内容就可以
专题分析
-
用户评论文本分析
-
用户留存分析 - 同期群分析
-
明确KPI 当前留存率比较低 当前留存是多少 行业的平均水平是什么样的
-
拉数据, 最近半年数据列出来, 分渠道, 分城市, 分设备类型.. 做同期群
-
得出结论
-
-
活动运营分析
-
活动前: 明确关键的KPI GMV (销售总金额) NMV( 净销售金额) 流量数据(每天访客数) 转化率
-
销售额 = 访客数* 转化率*客单价
-
人 货 场 (投放)
-
-
活动中: 做指标监控, 有波动了要及时发现问题
-
活动后: 回收数据, 做总结出报告
-
-
新产品投放调研分析
这篇关于Pandas——词云图绘制的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!