数据分析-day04-pandas-dataFrame字符串离散化,将一维字符串截取转换成矩阵,实现可视化展示

本文主要是介绍数据分析-day04-pandas-dataFrame字符串离散化,将一维字符串截取转换成矩阵,实现可视化展示,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

实现要求:将左边的图例转成右边矩阵的样子

 

技术关键点:

1.获取去重分类列表

2.构建全0矩阵

3.遍历赋值

zero_array.loc[m, d_list[m]] = 1  #等同于 # zero_array.loc[m, ['Action', 'Adventure', 'Sci-Fi']] = 1

#!usr/bin/env python
#-*- coding:utf-8 _*-
'''
@author:Administrator
@file: pandas_string_demo.py
@time: 2020-01-04 下午 3:31
'''
import pandas as pd;
import numpy as np
from matplotlib import pyplot as plt
d_file=pd.read_csv("../data/IMDB-Movie-Data.csv");
#d_file=d_file.head(5);
print(d_file.columns)
d_str=d_file["Genre"]
print(d_str)
print("#####################################1.截取string字符串实现分类##################")
d_list=d_str.str.split(",").tolist();
print(d_list)
print("#######################################2.获取分类列表,实现去重###########################")
b_list=[n for m in d_list for n in m]
print(b_list);
#去重
category_column=list(set(b_list));
print(category_column)
print("########################################3.构建全0数组###########################")
#有多少不同的分类,就设置多少列
zero_array=pd.DataFrame(np.zeros((d_file.shape[0],len(category_column))),columns=category_column)
print(zero_array)print("########################################4.给每个电影出现分类的位置赋值1###########################")for m in range(d_file.shape[0]):print(m,d_list[m])#d_list[m]=['Action', 'Adventure', 'Sci-Fi'],第m行中所有列中,包含d_list[m]所含有的类别,则赋值1#d_list中m个元素和m行是一一对应的zero_array.loc[m, d_list[m]] = 1  #等同于 # zero_array.loc[m, ['Action', 'Adventure', 'Sci-Fi']] = 1print(zero_array)print("########################################5.统计每个分类的电影的数量和,以count数进行排序###########################")
#统计每个分类的电影的数量和
genre_count = zero_array.sum(axis=0)
print(genre_count)
#排序,以count数作为排序依据
genre_count = genre_count.sort_values()
_x = genre_count.index
_y = genre_count.values
print(_x,_y)
print("########################################6.可视化展示()###########################")plt.figure(figsize=(20,8),dpi=60)
plt.bar(range(len(_x)),_y,width=0.2,color="orange");
plt.xticks(range(len(_x)),_x)
plt.show();

 

 

 

这篇关于数据分析-day04-pandas-dataFrame字符串离散化,将一维字符串截取转换成矩阵,实现可视化展示的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1013256

相关文章

C++对象布局及多态实现探索之内存布局(整理的很多链接)

本文通过观察对象的内存布局,跟踪函数调用的汇编代码。分析了C++对象内存的布局情况,虚函数的执行方式,以及虚继承,等等 文章链接:http://dev.yesky.com/254/2191254.shtml      论C/C++函数间动态内存的传递 (2005-07-30)   当你涉及到C/C++的核心编程的时候,你会无止境地与内存管理打交道。 文章链接:http://dev.yesky

可视化实训复习篇章

前言: 今天,我们来学习seaborn库可视化,当然,这个建立在Matplotlib的基础上,话不多说,进入今天的正题吧!当然,这个是《python数据分析与应用》书中,大家有需求的可以参考这本书。 知识点: Matplotlib中有两套接口分别是pyplot和pyylab,即绘图时候主要导入的是Matplotlib库下的两个子模块(两个py文件)matplotlib.pyplot和matp

通过SSH隧道实现通过远程服务器上外网

搭建隧道 autossh -M 0 -f -D 1080 -C -N user1@remotehost##验证隧道是否生效,查看1080端口是否启动netstat -tuln | grep 1080## 测试ssh 隧道是否生效curl -x socks5h://127.0.0.1:1080 -I http://www.github.com 将autossh 设置为服务,隧道开机启动

2390.从字符串中移除星号

给你一个包含若干星号 * 的字符串 s 。 在一步操作中,你可以: 选中 s 中的一个星号。 移除星号左侧最近的那个非星号字符,并移除该星号自身。 返回移除 所有 星号之后的字符串。 注意: 生成的输入保证总是可以执行题面中描述的操作。 可以证明结果字符串是唯一的。 示例 1: 输入:s = “leet**cod*e” 输出:“lecoe” 解释:从左到右执行移除操作: 距离第 1 个

Python 字符串占位

在Python中,可以使用字符串的格式化方法来实现字符串的占位。常见的方法有百分号操作符 % 以及 str.format() 方法 百分号操作符 % name = "张三"age = 20message = "我叫%s,今年%d岁。" % (name, age)print(message) # 我叫张三,今年20岁。 str.format() 方法 name = "张三"age

Windows/macOS/Linux 安装 Redis 和 Redis Desktop Manager 可视化工具

本文所有安装都在macOS High Sierra 10.13.4进行,Windows安装相对容易些,Linux安装与macOS类似,文中会做区分讲解 1. Redis安装 1.下载Redis https://redis.io/download 把下载的源码更名为redis-4.0.9-source,我喜欢跟maven、Tomcat放在一起,就放到/Users/zhan/Documents

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测 目录 时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测基本介绍程序设计参考资料 基本介绍 MATLAB实现LSTM时间序列未来多步预测-递归预测。LSTM是一种含有LSTM区块(blocks)或其他的一种类神经网络,文献或其他资料中LSTM区块可能被描述成智能网络单元,因为

vue项目集成CanvasEditor实现Word在线编辑器

CanvasEditor实现Word在线编辑器 官网文档:https://hufe.club/canvas-editor-docs/guide/schema.html 源码地址:https://github.com/Hufe921/canvas-editor 前提声明: 由于CanvasEditor目前不支持vue、react 等框架开箱即用版,所以需要我们去Git下载源码,拿到其中两个主

android一键分享功能部分实现

为什么叫做部分实现呢,其实是我只实现一部分的分享。如新浪微博,那还有没去实现的是微信分享。还有一部分奇怪的问题:我QQ分享跟QQ空间的分享功能,我都没配置key那些都是原本集成就有的key也可以实现分享,谁清楚的麻烦详解下。 实现分享功能我们可以去www.mob.com这个网站集成。免费的,而且还有短信验证功能。等这分享研究完后就研究下短信验证功能。 开始实现步骤(新浪分享,以下是本人自己实现

基于Springboot + vue 的抗疫物质管理系统的设计与实现

目录 📚 前言 📑摘要 📑系统流程 📚 系统架构设计 📚 数据库设计 📚 系统功能的具体实现    💬 系统登录注册 系统登录 登录界面   用户添加  💬 抗疫列表展示模块     区域信息管理 添加物资详情 抗疫物资列表展示 抗疫物资申请 抗疫物资审核 ✒️ 源码实现 💖 源码获取 😁 联系方式 📚 前言 📑博客主页: