儿科医生在国内需求分析

2023-11-09 17:30

本文主要是介绍儿科医生在国内需求分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

数据清洗

去重

创建、更新时间 数据类型转换

省份、市区清理

处理工资字段

数据分析

儿科医生的需求

儿科医生招聘经验要求

儿科医生学历高吗

职称对儿科医生高吗

儿科的工资待遇怎么样?

相当工资,医院对学历、职称等要求如何?

各地方省市对儿科医生的需求

儿科医生的要求和福利

总结


前言

这周跟着“[Alfred数据室]”分析了一篇关于儿科医生这个职位在国内的招聘要求、薪资水平、在医生招聘中所占比例等,今天把学到的和写的代码数据和大家做个分享,废话不多说,直接上代码来分析。

首先看一下数据的基本类型和结构,这个数据总共有27列数据,每一列代表不同的内容,例如:area代表地区、jobYearText代表工作年限,gradeText代表招聘级别。

all_data.info()

数据清洗

去重

但是这些数据太多了,有许多是不需要的,这里我们做一下清洗,把不需要的数据删除掉。

#把无用的字段删去,inplace代表在当前df中执行此操作
#根据id去重, drop_duplicates是去除完全重复的数据行
all_data.drop(columns=['_id', 'entLogo', 'region'], inplace=True)
all_data.drop_duplicates(subset='id', inplace=True)
all_data.sample(2)

 创建、更新时间 数据类型转换

我们需要增加2列数据内容,即把'createTime'和'updateTime'的数据类型转换。

all_data['createTime'] = pd.to_datetime(all_data['createTime'])
all_data['updateTime'] = pd.to_datetime(all_data['updateTime'])

省份、市区清理

由于儿科的数据是按照市为单位爬取的,而其它科是按省爬取的,所以area没有参考意义,如图所示,需要清理出省。

all_data['locationText'].unique()
all_data.loc[all_data['depType'] != '儿科', 'province'] = all_data.loc[all_data['depType'] != '儿科', 'area']
all_data.loc[(all_data['locationText'].str.contains('北京|上海|天津|重庆|自治区|省'))&(all_data['depType'] == '儿科'), 'province']= all_data.loc[(all_data['locationText'].str.contains('北京|上海|天津|重庆|自治区|省'))&(all_data['depType'] == '儿科'), 'locationText'].str.split('省|自治区|市', expand=True)[0]
all_data['city'] = all_data['locationText'].str.extract(r'(.{2}市)')
all_data['city']

处理工资字段

工资列的数据看着很乱,这里做下处理,统一一下工资字段从而方便后面的数据处理。这里使用一个自定义函数进行处理。

all_data['salaryText'].unique()def process_k(data):if '千' in data :return float(data.replace('千','')) *1000elif '万' in data :return float(data.replace('万','')) * 10000def process_salary(data):if data == '面议':return np.nanif '万以上' in data :return float(data.replace('万以上','')) * 10000if '千以下'  in data :return float(data.replace('千以下','')) * 1000if '-' in data :low, high = data.split('-')return (process_k(low) + process_k(high)) / 2all_data['salary'] = all_data['salaryText'].apply(process_salary)
all_data = all_data[-(all_data['salary']>100000)]
all_data.iloc[2600]

数据分析

儿科医生的需求

上面过程中我们把数据清洗完了,这里我们来对数据做进一步的分析,首先我们看一下,国内对儿科医生的需求量,儿科医生目标在招聘岗位有2359,期中公立医院对儿科医生需求量最大,其次是民营医院,还有部分医药、生物企业也在招聘儿科医生。

all_data[all_data['depType'] == '儿科'].shapetype_pct = all_data.loc[all_data['depType'] == '儿科','typeText'].value_counts() / all_data[all_data['depType'] == '儿科'].shape[0] *100
type_pctfrom pyecharts import Barbar = Bar("各类型单位招聘儿科岗位数百分比", width = 700,height=500)
bar.add("", type_pct.index, np.round(type_pct.values, 1), is_stack=True, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True,xaxis_rotate=20)
bar.render('各类型单位招聘儿科岗位数百分比.html')
bar

儿科医生招聘经验要求

大家知道,一般做医生的都需要经验,儿科医生也不例外,可以看出“经验不限”的所占比例最高,其次是工作5-10的。 但是公立医院对儿科医生的招聘年限要求比私立医院要宽松,公立和民营医院不太喜欢招聘应届儿科医生,这个也不难理解。

np.round(all_data.loc[all_data['depType']=='儿科','jobYearText'].value_counts() / all_data[all_data['depType'] == '儿科'].shape[0] * 100 ,1)

#公立医院对儿科医生的招聘经验要求百分比
pub_exp_pct = all_data.loc[(all_data['depType']=='儿科')&(all_data['typeText']=='公立医院'),'jobYearText'].value_counts()/all_data.loc[(all_data['depType']=='儿科')&(all_data['typeText']=='公立医院')].shape[0] * 100
np.round(pub_exp_pct,1)#私立医院对儿科招聘经验的要求百分比
ori_exp_pct = all_data.loc[(all_data['depType'] == '儿科')&(all_data['typeText']=='民营医院'),'jobYearText'].value_counts()/all_data.loc[(all_data['depType'] == '儿科')&(all_data['typeText']=='公立医院')].shape[0] *100
np.round(ori_exp_pct,1)# 公立/民营医院儿科医生招聘工作经验要求百分比
exp = ['应届生', '1-3年', '3-5年', '5-10年', '10年以上', '经验不限']
exp1 = [1.6, 12.9, 14.4, 14.8, 6.4, 49.4]
exp2 = [2.5, 9.2, 7.7, 8.1, 3.7, 68]
exp3 = [0.5, 17.8, 22.3, 21.1, 9.7, 28.7]
bar = Bar("公立/民营医院儿科医生招聘工作经验要求百分比", width = 600,height=500)
bar.add("平均",exp, exp1, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("公立医院",exp, exp2, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("民营医院",exp, exp3, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.render('公立、民营医院儿科医生招聘工作经验要求百分比.html')
bar

儿科医生学历高吗

大家都知道,医生行业的学历水平普遍要高一些,我认识的几个做医生的同学基本都是研究生毕业的,很少有本科生,即使是本科生也是那些名校毕业的,但是通过数据分析发现儿科医生本科毕业比例最高,其次是硕士、博士、大专。

np.round(all_data.loc[all_data['depType'] == '儿科','gradeText'].value_counts() /all_data[all_data['depType'] == '儿科'].shape[0] *100 ,1)# 公立医院儿科医生招聘学历要求百分比
np.round(all_data.loc[(all_data['depType'] == '儿科') & (all_data['typeText'] == '公立医院'),'gradeText'].value_counts() /all_data[(all_data['depType'] == '儿科') & (all_data['typeText'] == '公立医院')].shape[0] * 100,1)#民营医院儿科医生招聘学历要求百分比
np.round(all_data.loc[(all_data['depType'] == '儿科') & (all_data['typeText'] == '民营医院'),'gradeText'].value_counts() /all_data[(all_data['depType'] == '儿科') & (all_data['typeText'] == '民营医院')].shape[0] * 100,1)#公立/民营医院儿科医生招聘学历要求百分比
grade = ['大专', '本科', '硕士', '博士', '学历不限']
grade1 = [15.7, 51.7, 21.6, 4.7, 6.2]
grade2 = [4.1, 49.1, 34, 8.1, 4.7]
grade3 = [30, 54.7, 6.1, 0.6, 8.5]
bar = Bar("公立/民营医院儿科医生招聘学历要求百分比", width = 600,height=500)
bar.add("平均",grade, grade1, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("公立医院",grade, grade2, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("民营医院",grade, grade3, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.render('公立、民营医院儿科医生招聘学历要求百分比.html')
bar

职称对儿科医生高吗

各行各业基本都要求要有职称,一般职称越高的话,相应的薪资福利待遇也会更高一些,所以大家都要努力考证啊,从图中可以看出,公立医院对职称要求不高,民营医院起码要求是初级,而且占比最大,对职称要求更高一些,怪不得民营医院收费要高一些。

#公立和民营医院儿科医生招聘职称百分比
np.round(all_data.loc[all_data['depType'] == '儿科','positText'].value_counts() / all_data[all_data['depType'] == '儿科'].shape[0] *100,1)#公立医院儿科医生招聘职称百分比
np.round(all_data.loc[(all_data['depType'] == '儿科') & (all_data['typeText']=='公立医院'),'positText'].value_counts() / all_data[(all_data['depType'] == '儿科') & (all_data['typeText']=='公立医院')].shape[0] * 100,1)#私立医院儿科医生招聘职称百分比
np.round(all_data.loc[(all_data['depType'] == '儿科') & (all_data['typeText']=='民营医院'),'positText'].value_counts() / all_data[(all_data['depType'] == '儿科') & (all_data['typeText']=='民营医院')].shape[0] * 100,1)#公立/民营医院儿科医生招聘职称要求百分比图形绘制
level = ['初级', '中级', '副高', '高级', '不限']
level1 = [27.6, 17.2, 10.5, 2.5, 36.4]
level2 = [25, 8.1, 10.7, 3, 46.6]
level3 = [33.2, 26.3, 10.3, 1.9, 23.7]
bar = Bar("公立/民营医院儿科医生招聘职称要求百分比", width = 600,height=500)
bar.add("平均",level, level1, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("公立医院",level, level2, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("民营医院",level, level3, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
#bar.render('公立/民营医院儿科医生招聘职称百分比.html')
bar.render('公立、民营医院儿科医生招聘职称要求百分比.html')
bar

儿科的工资待遇怎么样?

医生的薪资一般来说是根据工作经验和职称来定的,当然这里排出了其他方面的"shouru"。 从数据可以看出,儿科医生的平均薪资要高于其他科室的医生,达到13328。薪资果然是高啊,看到这我这个小渣渣沉默了。

                                                                å¥½äºï¼ä½ ä¸è¦å说äºï¼çå­ï¼è¡¨æ

mean_salary = all_data.groupby('depType')['salary'].mean().sort_values()#绘制图形   儿科平均工资与其它科室对比
bar = Bar("儿科平均工资与其它科室对比", width = 600,height=400)
bar.add("", mean_salary.index, np.round(mean_salary.values, 0), is_stack=True, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, )
bar.render('儿科平均工资与其它科室对比.html')
bar

各类型单位招聘的儿科平均工资,期中生物药企企业的儿科医生薪资最高,达到17000,其次就是医药企业。所以但看工资水平的话,生物企业和医药企业更有诱惑力。

#"各类型单位儿科平均工资"
all_data[all_data['depType']=='儿科'].groupby('typeText')['salary'].count()#drop删除科研究院的数据
erke_srl =all_data[all_data['depType']=='儿科'].groupby('typeText')['salary'].mean().drop(index='科研院校').sort_values()
erke_srlbar = Bar("各类型单位儿科平均工资", width = 600,height=500)
bar.add("",erke_srl.index, np.round(erke_srl.values, 0), is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, xaxis_rotate=20)
bar.render('各类型单位儿科平均工资.html')
bar

相当工资,医院对学历、职称等要求如何?

在工资水平相同的情况下,公立医院本科的占比要比民营医院高,换句话说你如果是本科毕业的儿科生在公立医院拿到8-10K的概率要比民营医院要大得多。

all_data[(all_data['depType']=='儿科')&(all_data['salary']>8000)&(all_data['salary']<10000)&(all_data['typeText'].isin(['公立医院', '民营医院']))].groupby(['typeText', 'gradeText'])['id'].count()

grade_same1 = np.round(np.array([3, 31, 12, 1, 0]) / (3+31+12+1)*100, 1)
#grade_same1grade_same2 = np.round(np.array([18, 21, 2, 0, 8]) / (18+21+2+8)*100, 1)
grade_same2

#相同工资水平下公立/民营医院对学历的要求百分比(8k-10k)
bar = Bar("相同工资水平下公立/民营医院对学历的要求百分比(8k-10k)", width = 600,height=600)
bar.add("公立医院",grade, grade_same1, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30)
bar.add("民营医院", grade, grade_same2, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30)
bar

各地方省市对儿科医生的需求

从上面分析可知,全国范围内共有2359个儿科医生招聘岗位,通过进一部分析可知,广东省儿科招聘岗位最大,其次是北京、上海、江苏、浙江等经济发达地区。

# 对于province的处理结果还不是很满意,再处理以下
def get_province(data):province = ['北京', '天津', '河北', '山西', '内蒙古', '辽宁', '吉林', '黑龙江', '上海', '江苏', '浙江', '安徽', '福建', '江西', '山东', '河南', '湖北', '湖南', '广东', '广西', '海南', '重庆', '四川', '贵州', '云南', '西藏', '陕西', '甘肃', '青海', '宁夏', '新疆', '台湾', '香港', '澳门', '国外']for i in province:if i in data:return i
all_data.loc[all_data['depType']=='儿科', 'province2'] = all_data.loc[all_data['depType']=='儿科', 'locationText'].apply(get_province)
#all_data['province2']demand = all_data.loc[all_data['depType']=='儿科', 'province2'].value_counts()
demand

儿科医生的要求和福利

儿科医生的要求也进一步进行分类如儿科护士长、新生儿科、儿科临床医师。薪资福利有五险一金、房贴、工作餐、带薪年假。

from collections import Counter
from pyecharts import WordCloudg = all_data.loc[all_data['depType']=='儿科', 'gradeText'].value_counts()
y = all_data.loc[all_data['depType']=='儿科', 'jobYearText'].value_counts()l = all_data.loc[all_data['depType']=='儿科', 'levelText'].value_counts()
n = all_data.loc[all_data['depType']=='儿科', 'name'].value_counts()
p = all_data.loc[all_data['depType']=='儿科', 'positText'].value_counts()
t = all_data.loc[all_data['depType']=='儿科', 'typeText'].value_counts()welfare= []
for i in all_data.loc[all_data['depType']=='儿科', 'welfare']:if len(i) > 0:welfare.extend(i)
w = pd.Series(Counter(welfare))
all = pd.concat([g, y, l, n, p, t, w])name, value = all.index, all.values
wordcloud = WordCloud(width=800, height=800)
wordcloud.add("", name, value, word_size_range=[20, 80])
wordcloud

总结

通过以上分析可知,儿科以上在薪资、福利待遇是个不错的行业,但是它对职称和工作经验也有较高的要求。民营医院的招聘要求要更严格一些,生物企业、医药企业薪资更加诱惑。

大家看了有感兴趣的需要具体代码的可以私下交流,也希望各位能多多提供些宝贵意见。

这篇关于儿科医生在国内需求分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/377533

相关文章

Java字符串操作技巧之语法、示例与应用场景分析

《Java字符串操作技巧之语法、示例与应用场景分析》在Java算法题和日常开发中,字符串处理是必备的核心技能,本文全面梳理Java中字符串的常用操作语法,结合代码示例、应用场景和避坑指南,可快速掌握字... 目录引言1. 基础操作1.1 创建字符串1.2 获取长度1.3 访问字符2. 字符串处理2.1 子字

Android Studio 配置国内镜像源的实现步骤

《AndroidStudio配置国内镜像源的实现步骤》本文主要介绍了AndroidStudio配置国内镜像源的实现步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录一、修改 hosts,解决 SDK 下载失败的问题二、修改 gradle 地址,解决 gradle

Python 迭代器和生成器概念及场景分析

《Python迭代器和生成器概念及场景分析》yield是Python中实现惰性计算和协程的核心工具,结合send()、throw()、close()等方法,能够构建高效、灵活的数据流和控制流模型,这... 目录迭代器的介绍自定义迭代器省略的迭代器生产器的介绍yield的普通用法yield的高级用法yidle

C++ Sort函数使用场景分析

《C++Sort函数使用场景分析》sort函数是algorithm库下的一个函数,sort函数是不稳定的,即大小相同的元素在排序后相对顺序可能发生改变,如果某些场景需要保持相同元素间的相对顺序,可使... 目录C++ Sort函数详解一、sort函数调用的两种方式二、sort函数使用场景三、sort函数排序

kotlin中const 和val的区别及使用场景分析

《kotlin中const和val的区别及使用场景分析》在Kotlin中,const和val都是用来声明常量的,但它们的使用场景和功能有所不同,下面给大家介绍kotlin中const和val的区别,... 目录kotlin中const 和val的区别1. val:2. const:二 代码示例1 Java

Go标准库常见错误分析和解决办法

《Go标准库常见错误分析和解决办法》Go语言的标准库为开发者提供了丰富且高效的工具,涵盖了从网络编程到文件操作等各个方面,然而,标准库虽好,使用不当却可能适得其反,正所谓工欲善其事,必先利其器,本文将... 目录1. 使用了错误的time.Duration2. time.After导致的内存泄漏3. jsO

Spring事务中@Transactional注解不生效的原因分析与解决

《Spring事务中@Transactional注解不生效的原因分析与解决》在Spring框架中,@Transactional注解是管理数据库事务的核心方式,本文将深入分析事务自调用的底层原理,解释为... 目录1. 引言2. 事务自调用问题重现2.1 示例代码2.2 问题现象3. 为什么事务自调用会失效3

找不到Anaconda prompt终端的原因分析及解决方案

《找不到Anacondaprompt终端的原因分析及解决方案》因为anaconda还没有初始化,在安装anaconda的过程中,有一行是否要添加anaconda到菜单目录中,由于没有勾选,导致没有菜... 目录问题原因问http://www.chinasem.cn题解决安装了 Anaconda 却找不到 An

Spring定时任务只执行一次的原因分析与解决方案

《Spring定时任务只执行一次的原因分析与解决方案》在使用Spring的@Scheduled定时任务时,你是否遇到过任务只执行一次,后续不再触发的情况?这种情况可能由多种原因导致,如未启用调度、线程... 目录1. 问题背景2. Spring定时任务的基本用法3. 为什么定时任务只执行一次?3.1 未启用

C++ 各种map特点对比分析

《C++各种map特点对比分析》文章比较了C++中不同类型的map(如std::map,std::unordered_map,std::multimap,std::unordered_multima... 目录特点比较C++ 示例代码 ​​​​​​代码解释特点比较1. std::map底层实现:基于红黑