本文主要是介绍胸罩数据分析以及可视化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
胸罩数据分析以及可视化
上次用爬虫爬取了天猫还有京东的胸罩数据,不能让数据躺在硬盘里边睡大觉,不用来分析的数据和垃圾没有区别。所以今天就对采集到的数据进行分析,主要是胸罩种类分析,以及罩杯种类分析。
数据库中数据结构如下图:
分析数据以主要使用pandas,可视化使用matplotlib。基本用法就不提了,百度一大把。这里推荐《利用python》进行数据分析一书,某东某当都有卖的。下边主要提几个主要的函数以及用法。
- Series.to_frame(): 将pandas的series对象转化为dataframe对象,参数name可以指定column的名称
- pandas.index.tolist(): 可以将索引转化为列表,方便操作索引,对多重索引也试用。
- pandas.concat(DataFrame1,DataFrame2): 可以连接两个DataFraem.
代码如下,内容有注释:
# -*- coding: utf-8 -*-
# @Author: Nessaj
# @Date: 2018-05-22 18:07:40
# @Last Modified by: Nessaj
# @Last Modified time: 2018-05-22 20:24:04
# -*- coding: utf-8 -*-
# @Author: Nessaj
# @Date: 2018-03-18 22:47:47
# @Last Modified by: Nessaj
# @Last Modified time: 2018-03-31 14:29:39
from matplotlib import pyplot as plt
from pandas import DataFrame
import pandas as pd
import sqlalchemy
import numpy
这篇关于胸罩数据分析以及可视化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!