儿科医生在国内需求分析

本文主要是介绍儿科医生在国内需求分析，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

前言

数据清洗

去重

创建、更新时间数据类型转换

省份、市区清理

处理工资字段

数据分析

儿科医生的需求

儿科医生招聘经验要求

儿科医生学历高吗

职称对儿科医生高吗

儿科的工资待遇怎么样？

相当工资，医院对学历、职称等要求如何？

各地方省市对儿科医生的需求

儿科医生的要求和福利

总结

前言

这周跟着“[Alfred数据室]”分析了一篇关于儿科医生这个职位在国内的招聘要求、薪资水平、在医生招聘中所占比例等，今天把学到的和写的代码数据和大家做个分享，废话不多说，直接上代码来分析。

首先看一下数据的基本类型和结构,这个数据总共有27列数据，每一列代表不同的内容，例如：area代表地区、jobYearText代表工作年限，gradeText代表招聘级别。

all_data.info()

数据清洗

去重

但是这些数据太多了，有许多是不需要的，这里我们做一下清洗，把不需要的数据删除掉。

#把无用的字段删去,inplace代表在当前df中执行此操作
#根据id去重, drop_duplicates是去除完全重复的数据行
all_data.drop(columns=['_id', 'entLogo', 'region'], inplace=True)
all_data.drop_duplicates(subset='id', inplace=True)
all_data.sample(2)

创建、更新时间数据类型转换

我们需要增加2列数据内容，即把'createTime'和'updateTime'的数据类型转换。

all_data['createTime'] = pd.to_datetime(all_data['createTime'])
all_data['updateTime'] = pd.to_datetime(all_data['updateTime'])

省份、市区清理

由于儿科的数据是按照市为单位爬取的，而其它科是按省爬取的，所以area没有参考意义，如图所示，需要清理出省。

all_data['locationText'].unique()
all_data.loc[all_data['depType'] != '儿科', 'province'] = all_data.loc[all_data['depType'] != '儿科', 'area']
all_data.loc[(all_data['locationText'].str.contains('北京|上海|天津|重庆|自治区|省'))&(all_data['depType'] == '儿科'), 'province']= all_data.loc[(all_data['locationText'].str.contains('北京|上海|天津|重庆|自治区|省'))&(all_data['depType'] == '儿科'), 'locationText'].str.split('省|自治区|市', expand=True)[0]
all_data['city'] = all_data['locationText'].str.extract(r'(.{2}市)')
all_data['city']

处理工资字段

工资列的数据看着很乱，这里做下处理，统一一下工资字段从而方便后面的数据处理。这里使用一个自定义函数进行处理。

all_data['salaryText'].unique()def process_k(data):if '千' in data :return float(data.replace('千','')) *1000elif '万' in data :return float(data.replace('万','')) * 10000def process_salary(data):if data == '面议':return np.nanif '万以上' in data :return float(data.replace('万以上','')) * 10000if '千以下'  in data :return float(data.replace('千以下','')) * 1000if '-' in data :low, high = data.split('-')return (process_k(low) + process_k(high)) / 2all_data['salary'] = all_data['salaryText'].apply(process_salary)
all_data = all_data[-(all_data['salary']>100000)]
all_data.iloc[2600]

数据分析

儿科医生的需求

上面过程中我们把数据清洗完了，这里我们来对数据做进一步的分析，首先我们看一下，国内对儿科医生的需求量，儿科医生目标在招聘岗位有2359，期中公立医院对儿科医生需求量最大，其次是民营医院，还有部分医药、生物企业也在招聘儿科医生。

all_data[all_data['depType'] == '儿科'].shapetype_pct = all_data.loc[all_data['depType'] == '儿科','typeText'].value_counts() / all_data[all_data['depType'] == '儿科'].shape[0] *100
type_pctfrom pyecharts import Barbar = Bar("各类型单位招聘儿科岗位数百分比", width = 700,height=500)
bar.add("", type_pct.index, np.round(type_pct.values, 1), is_stack=True, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True,xaxis_rotate=20)
bar.render('各类型单位招聘儿科岗位数百分比.html')
bar

儿科医生招聘经验要求

大家知道，一般做医生的都需要经验，儿科医生也不例外，可以看出“经验不限”的所占比例最高，其次是工作5-10的。但是公立医院对儿科医生的招聘年限要求比私立医院要宽松，公立和民营医院不太喜欢招聘应届儿科医生，这个也不难理解。

np.round(all_data.loc[all_data['depType']=='儿科','jobYearText'].value_counts() / all_data[all_data['depType'] == '儿科'].shape[0] * 100 ,1)

#公立医院对儿科医生的招聘经验要求百分比
pub_exp_pct = all_data.loc[(all_data['depType']=='儿科')&(all_data['typeText']=='公立医院'),'jobYearText'].value_counts()/all_data.loc[(all_data['depType']=='儿科')&(all_data['typeText']=='公立医院')].shape[0] * 100
np.round(pub_exp_pct,1)#私立医院对儿科招聘经验的要求百分比
ori_exp_pct = all_data.loc[(all_data['depType'] == '儿科')&(all_data['typeText']=='民营医院'),'jobYearText'].value_counts()/all_data.loc[(all_data['depType'] == '儿科')&(all_data['typeText']=='公立医院')].shape[0] *100
np.round(ori_exp_pct,1)# 公立/民营医院儿科医生招聘工作经验要求百分比
exp = ['应届生', '1-3年', '3-5年', '5-10年', '10年以上', '经验不限']
exp1 = [1.6, 12.9, 14.4, 14.8, 6.4, 49.4]
exp2 = [2.5, 9.2, 7.7, 8.1, 3.7, 68]
exp3 = [0.5, 17.8, 22.3, 21.1, 9.7, 28.7]
bar = Bar("公立/民营医院儿科医生招聘工作经验要求百分比", width = 600,height=500)
bar.add("平均",exp, exp1, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("公立医院",exp, exp2, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("民营医院",exp, exp3, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.render('公立、民营医院儿科医生招聘工作经验要求百分比.html')
bar

儿科医生学历高吗

大家都知道，医生行业的学历水平普遍要高一些，我认识的几个做医生的同学基本都是研究生毕业的，很少有本科生，即使是本科生也是那些名校毕业的，但是通过数据分析发现儿科医生本科毕业比例最高，其次是硕士、博士、大专。

np.round(all_data.loc[all_data['depType'] == '儿科','gradeText'].value_counts() /all_data[all_data['depType'] == '儿科'].shape[0] *100 ,1)# 公立医院儿科医生招聘学历要求百分比
np.round(all_data.loc[(all_data['depType'] == '儿科') & (all_data['typeText'] == '公立医院'),'gradeText'].value_counts() /all_data[(all_data['depType'] == '儿科') & (all_data['typeText'] == '公立医院')].shape[0] * 100,1)#民营医院儿科医生招聘学历要求百分比
np.round(all_data.loc[(all_data['depType'] == '儿科') & (all_data['typeText'] == '民营医院'),'gradeText'].value_counts() /all_data[(all_data['depType'] == '儿科') & (all_data['typeText'] == '民营医院')].shape[0] * 100,1)#公立/民营医院儿科医生招聘学历要求百分比
grade = ['大专', '本科', '硕士', '博士', '学历不限']
grade1 = [15.7, 51.7, 21.6, 4.7, 6.2]
grade2 = [4.1, 49.1, 34, 8.1, 4.7]
grade3 = [30, 54.7, 6.1, 0.6, 8.5]
bar = Bar("公立/民营医院儿科医生招聘学历要求百分比", width = 600,height=500)
bar.add("平均",grade, grade1, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("公立医院",grade, grade2, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("民营医院",grade, grade3, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.render('公立、民营医院儿科医生招聘学历要求百分比.html')
bar

职称对儿科医生高吗

各行各业基本都要求要有职称，一般职称越高的话，相应的薪资福利待遇也会更高一些，所以大家都要努力考证啊，从图中可以看出，公立医院对职称要求不高，民营医院起码要求是初级，而且占比最大，对职称要求更高一些，怪不得民营医院收费要高一些。

#公立和民营医院儿科医生招聘职称百分比
np.round(all_data.loc[all_data['depType'] == '儿科','positText'].value_counts() / all_data[all_data['depType'] == '儿科'].shape[0] *100,1)#公立医院儿科医生招聘职称百分比
np.round(all_data.loc[(all_data['depType'] == '儿科') & (all_data['typeText']=='公立医院'),'positText'].value_counts() / all_data[(all_data['depType'] == '儿科') & (all_data['typeText']=='公立医院')].shape[0] * 100,1)#私立医院儿科医生招聘职称百分比
np.round(all_data.loc[(all_data['depType'] == '儿科') & (all_data['typeText']=='民营医院'),'positText'].value_counts() / all_data[(all_data['depType'] == '儿科') & (all_data['typeText']=='民营医院')].shape[0] * 100,1)#公立/民营医院儿科医生招聘职称要求百分比图形绘制
level = ['初级', '中级', '副高', '高级', '不限']
level1 = [27.6, 17.2, 10.5, 2.5, 36.4]
level2 = [25, 8.1, 10.7, 3, 46.6]
level3 = [33.2, 26.3, 10.3, 1.9, 23.7]
bar = Bar("公立/民营医院儿科医生招聘职称要求百分比", width = 600,height=500)
bar.add("平均",level, level1, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("公立医院",level, level2, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("民营医院",level, level3, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
#bar.render('公立/民营医院儿科医生招聘职称百分比.html')
bar.render('公立、民营医院儿科医生招聘职称要求百分比.html')
bar

儿科的工资待遇怎么样？

医生的薪资一般来说是根据工作经验和职称来定的，当然这里排出了其他方面的"shouru"。从数据可以看出，儿科医生的平均薪资要高于其他科室的医生，达到13328。薪资果然是高啊，看到这我这个小渣渣沉默了。

å¥½äºï¼ä½ ä¸è¦åè¯´äºï¼çåï¼è¡¨æ

mean_salary = all_data.groupby('depType')['salary'].mean().sort_values()#绘制图形   儿科平均工资与其它科室对比
bar = Bar("儿科平均工资与其它科室对比", width = 600,height=400)
bar.add("", mean_salary.index, np.round(mean_salary.values, 0), is_stack=True, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, )
bar.render('儿科平均工资与其它科室对比.html')
bar

各类型单位招聘的儿科平均工资，期中生物药企企业的儿科医生薪资最高，达到17000，其次就是医药企业。所以但看工资水平的话，生物企业和医药企业更有诱惑力。

#"各类型单位儿科平均工资"
all_data[all_data['depType']=='儿科'].groupby('typeText')['salary'].count()#drop删除科研究院的数据
erke_srl =all_data[all_data['depType']=='儿科'].groupby('typeText')['salary'].mean().drop(index='科研院校').sort_values()
erke_srlbar = Bar("各类型单位儿科平均工资", width = 600,height=500)
bar.add("",erke_srl.index, np.round(erke_srl.values, 0), is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, xaxis_rotate=20)
bar.render('各类型单位儿科平均工资.html')
bar

相当工资，医院对学历、职称等要求如何？

在工资水平相同的情况下，公立医院本科的占比要比民营医院高，换句话说你如果是本科毕业的儿科生在公立医院拿到8-10K的概率要比民营医院要大得多。

all_data[(all_data['depType']=='儿科')&(all_data['salary']>8000)&(all_data['salary']<10000)&(all_data['typeText'].isin(['公立医院', '民营医院']))].groupby(['typeText', 'gradeText'])['id'].count()

grade_same1 = np.round(np.array([3, 31, 12, 1, 0]) / (3+31+12+1)*100, 1)
#grade_same1grade_same2 = np.round(np.array([18, 21, 2, 0, 8]) / (18+21+2+8)*100, 1)
grade_same2

#相同工资水平下公立/民营医院对学历的要求百分比(8k-10k)
bar = Bar("相同工资水平下公立/民营医院对学历的要求百分比(8k-10k)", width = 600,height=600)
bar.add("公立医院",grade, grade_same1, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30)
bar.add("民营医院", grade, grade_same2, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30)
bar

各地方省市对儿科医生的需求

从上面分析可知，全国范围内共有2359个儿科医生招聘岗位，通过进一部分析可知，广东省儿科招聘岗位最大，其次是北京、上海、江苏、浙江等经济发达地区。

# 对于province的处理结果还不是很满意，再处理以下
def get_province(data):province = ['北京', '天津', '河北', '山西', '内蒙古', '辽宁', '吉林', '黑龙江', '上海', '江苏', '浙江', '安徽', '福建', '江西', '山东', '河南', '湖北', '湖南', '广东', '广西', '海南', '重庆', '四川', '贵州', '云南', '西藏', '陕西', '甘肃', '青海', '宁夏', '新疆', '台湾', '香港', '澳门', '国外']for i in province:if i in data:return i
all_data.loc[all_data['depType']=='儿科', 'province2'] = all_data.loc[all_data['depType']=='儿科', 'locationText'].apply(get_province)
#all_data['province2']demand = all_data.loc[all_data['depType']=='儿科', 'province2'].value_counts()
demand

儿科医生的要求和福利

儿科医生的要求也进一步进行分类如儿科护士长、新生儿科、儿科临床医师。薪资福利有五险一金、房贴、工作餐、带薪年假。

from collections import Counter
from pyecharts import WordCloudg = all_data.loc[all_data['depType']=='儿科', 'gradeText'].value_counts()
y = all_data.loc[all_data['depType']=='儿科', 'jobYearText'].value_counts()l = all_data.loc[all_data['depType']=='儿科', 'levelText'].value_counts()
n = all_data.loc[all_data['depType']=='儿科', 'name'].value_counts()
p = all_data.loc[all_data['depType']=='儿科', 'positText'].value_counts()
t = all_data.loc[all_data['depType']=='儿科', 'typeText'].value_counts()welfare= []
for i in all_data.loc[all_data['depType']=='儿科', 'welfare']:if len(i) > 0:welfare.extend(i)
w = pd.Series(Counter(welfare))
all = pd.concat([g, y, l, n, p, t, w])name, value = all.index, all.values
wordcloud = WordCloud(width=800, height=800)
wordcloud.add("", name, value, word_size_range=[20, 80])
wordcloud

总结

通过以上分析可知，儿科以上在薪资、福利待遇是个不错的行业，但是它对职称和工作经验也有较高的要求。民营医院的招聘要求要更严格一些，生物企业、医药企业薪资更加诱惑。

大家看了有感兴趣的需要具体代码的可以私下交流，也希望各位能多多提供些宝贵意见。

这篇关于儿科医生在国内需求分析的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

儿科医生在国内需求分析

前言

数据清洗

去重

创建、更新时间数据类型转换

省份、市区清理

处理工资字段

数据分析

儿科医生的需求

儿科医生招聘经验要求

儿科医生学历高吗

职称对儿科医生高吗

儿科的工资待遇怎么样？

相当工资，医院对学历、职称等要求如何？

各地方省市对儿科医生的需求

儿科医生的要求和福利

总结

相关文章

MySQL中的LENGTH()函数用法详解与实例分析

Android kotlin中 Channel 和 Flow 的区别和选择使用场景分析

怎样通过分析GC日志来定位Java进程的内存问题

MySQL中的表连接原理分析

python中Hash使用场景分析

Java Stream的distinct去重原理分析

关于MyISAM和InnoDB对比分析

MyBatis Plus 中 update_time 字段自动填充失效的原因分析及解决方案(最新整理)

Python主动抛出异常的各种用法和场景分析

github打不开的问题分析及解决

儿科医生在国内需求分析

前言

数据清洗

去重

创建、更新时间 数据类型转换

省份、市区清理

处理工资字段

数据分析

儿科医生的需求

儿科医生招聘经验要求

儿科医生学历高吗

职称对儿科医生高吗

儿科的工资待遇怎么样？

相当工资，医院对学历、职称等要求如何？

各地方省市对儿科医生的需求

儿科医生的要求和福利

总结

相关文章

创建、更新时间数据类型转换