儿科医生在国内需求分析

2023-11-09 17:30

本文主要是介绍儿科医生在国内需求分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

数据清洗

去重

创建、更新时间 数据类型转换

省份、市区清理

处理工资字段

数据分析

儿科医生的需求

儿科医生招聘经验要求

儿科医生学历高吗

职称对儿科医生高吗

儿科的工资待遇怎么样?

相当工资,医院对学历、职称等要求如何?

各地方省市对儿科医生的需求

儿科医生的要求和福利

总结


前言

这周跟着“[Alfred数据室]”分析了一篇关于儿科医生这个职位在国内的招聘要求、薪资水平、在医生招聘中所占比例等,今天把学到的和写的代码数据和大家做个分享,废话不多说,直接上代码来分析。

首先看一下数据的基本类型和结构,这个数据总共有27列数据,每一列代表不同的内容,例如:area代表地区、jobYearText代表工作年限,gradeText代表招聘级别。

all_data.info()

数据清洗

去重

但是这些数据太多了,有许多是不需要的,这里我们做一下清洗,把不需要的数据删除掉。

#把无用的字段删去,inplace代表在当前df中执行此操作
#根据id去重, drop_duplicates是去除完全重复的数据行
all_data.drop(columns=['_id', 'entLogo', 'region'], inplace=True)
all_data.drop_duplicates(subset='id', inplace=True)
all_data.sample(2)

 创建、更新时间 数据类型转换

我们需要增加2列数据内容,即把'createTime'和'updateTime'的数据类型转换。

all_data['createTime'] = pd.to_datetime(all_data['createTime'])
all_data['updateTime'] = pd.to_datetime(all_data['updateTime'])

省份、市区清理

由于儿科的数据是按照市为单位爬取的,而其它科是按省爬取的,所以area没有参考意义,如图所示,需要清理出省。

all_data['locationText'].unique()
all_data.loc[all_data['depType'] != '儿科', 'province'] = all_data.loc[all_data['depType'] != '儿科', 'area']
all_data.loc[(all_data['locationText'].str.contains('北京|上海|天津|重庆|自治区|省'))&(all_data['depType'] == '儿科'), 'province']= all_data.loc[(all_data['locationText'].str.contains('北京|上海|天津|重庆|自治区|省'))&(all_data['depType'] == '儿科'), 'locationText'].str.split('省|自治区|市', expand=True)[0]
all_data['city'] = all_data['locationText'].str.extract(r'(.{2}市)')
all_data['city']

处理工资字段

工资列的数据看着很乱,这里做下处理,统一一下工资字段从而方便后面的数据处理。这里使用一个自定义函数进行处理。

all_data['salaryText'].unique()def process_k(data):if '千' in data :return float(data.replace('千','')) *1000elif '万' in data :return float(data.replace('万','')) * 10000def process_salary(data):if data == '面议':return np.nanif '万以上' in data :return float(data.replace('万以上','')) * 10000if '千以下'  in data :return float(data.replace('千以下','')) * 1000if '-' in data :low, high = data.split('-')return (process_k(low) + process_k(high)) / 2all_data['salary'] = all_data['salaryText'].apply(process_salary)
all_data = all_data[-(all_data['salary']>100000)]
all_data.iloc[2600]

数据分析

儿科医生的需求

上面过程中我们把数据清洗完了,这里我们来对数据做进一步的分析,首先我们看一下,国内对儿科医生的需求量,儿科医生目标在招聘岗位有2359,期中公立医院对儿科医生需求量最大,其次是民营医院,还有部分医药、生物企业也在招聘儿科医生。

all_data[all_data['depType'] == '儿科'].shapetype_pct = all_data.loc[all_data['depType'] == '儿科','typeText'].value_counts() / all_data[all_data['depType'] == '儿科'].shape[0] *100
type_pctfrom pyecharts import Barbar = Bar("各类型单位招聘儿科岗位数百分比", width = 700,height=500)
bar.add("", type_pct.index, np.round(type_pct.values, 1), is_stack=True, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True,xaxis_rotate=20)
bar.render('各类型单位招聘儿科岗位数百分比.html')
bar

儿科医生招聘经验要求

大家知道,一般做医生的都需要经验,儿科医生也不例外,可以看出“经验不限”的所占比例最高,其次是工作5-10的。 但是公立医院对儿科医生的招聘年限要求比私立医院要宽松,公立和民营医院不太喜欢招聘应届儿科医生,这个也不难理解。

np.round(all_data.loc[all_data['depType']=='儿科','jobYearText'].value_counts() / all_data[all_data['depType'] == '儿科'].shape[0] * 100 ,1)

#公立医院对儿科医生的招聘经验要求百分比
pub_exp_pct = all_data.loc[(all_data['depType']=='儿科')&(all_data['typeText']=='公立医院'),'jobYearText'].value_counts()/all_data.loc[(all_data['depType']=='儿科')&(all_data['typeText']=='公立医院')].shape[0] * 100
np.round(pub_exp_pct,1)#私立医院对儿科招聘经验的要求百分比
ori_exp_pct = all_data.loc[(all_data['depType'] == '儿科')&(all_data['typeText']=='民营医院'),'jobYearText'].value_counts()/all_data.loc[(all_data['depType'] == '儿科')&(all_data['typeText']=='公立医院')].shape[0] *100
np.round(ori_exp_pct,1)# 公立/民营医院儿科医生招聘工作经验要求百分比
exp = ['应届生', '1-3年', '3-5年', '5-10年', '10年以上', '经验不限']
exp1 = [1.6, 12.9, 14.4, 14.8, 6.4, 49.4]
exp2 = [2.5, 9.2, 7.7, 8.1, 3.7, 68]
exp3 = [0.5, 17.8, 22.3, 21.1, 9.7, 28.7]
bar = Bar("公立/民营医院儿科医生招聘工作经验要求百分比", width = 600,height=500)
bar.add("平均",exp, exp1, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("公立医院",exp, exp2, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("民营医院",exp, exp3, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.render('公立、民营医院儿科医生招聘工作经验要求百分比.html')
bar

儿科医生学历高吗

大家都知道,医生行业的学历水平普遍要高一些,我认识的几个做医生的同学基本都是研究生毕业的,很少有本科生,即使是本科生也是那些名校毕业的,但是通过数据分析发现儿科医生本科毕业比例最高,其次是硕士、博士、大专。

np.round(all_data.loc[all_data['depType'] == '儿科','gradeText'].value_counts() /all_data[all_data['depType'] == '儿科'].shape[0] *100 ,1)# 公立医院儿科医生招聘学历要求百分比
np.round(all_data.loc[(all_data['depType'] == '儿科') & (all_data['typeText'] == '公立医院'),'gradeText'].value_counts() /all_data[(all_data['depType'] == '儿科') & (all_data['typeText'] == '公立医院')].shape[0] * 100,1)#民营医院儿科医生招聘学历要求百分比
np.round(all_data.loc[(all_data['depType'] == '儿科') & (all_data['typeText'] == '民营医院'),'gradeText'].value_counts() /all_data[(all_data['depType'] == '儿科') & (all_data['typeText'] == '民营医院')].shape[0] * 100,1)#公立/民营医院儿科医生招聘学历要求百分比
grade = ['大专', '本科', '硕士', '博士', '学历不限']
grade1 = [15.7, 51.7, 21.6, 4.7, 6.2]
grade2 = [4.1, 49.1, 34, 8.1, 4.7]
grade3 = [30, 54.7, 6.1, 0.6, 8.5]
bar = Bar("公立/民营医院儿科医生招聘学历要求百分比", width = 600,height=500)
bar.add("平均",grade, grade1, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("公立医院",grade, grade2, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("民营医院",grade, grade3, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.render('公立、民营医院儿科医生招聘学历要求百分比.html')
bar

职称对儿科医生高吗

各行各业基本都要求要有职称,一般职称越高的话,相应的薪资福利待遇也会更高一些,所以大家都要努力考证啊,从图中可以看出,公立医院对职称要求不高,民营医院起码要求是初级,而且占比最大,对职称要求更高一些,怪不得民营医院收费要高一些。

#公立和民营医院儿科医生招聘职称百分比
np.round(all_data.loc[all_data['depType'] == '儿科','positText'].value_counts() / all_data[all_data['depType'] == '儿科'].shape[0] *100,1)#公立医院儿科医生招聘职称百分比
np.round(all_data.loc[(all_data['depType'] == '儿科') & (all_data['typeText']=='公立医院'),'positText'].value_counts() / all_data[(all_data['depType'] == '儿科') & (all_data['typeText']=='公立医院')].shape[0] * 100,1)#私立医院儿科医生招聘职称百分比
np.round(all_data.loc[(all_data['depType'] == '儿科') & (all_data['typeText']=='民营医院'),'positText'].value_counts() / all_data[(all_data['depType'] == '儿科') & (all_data['typeText']=='民营医院')].shape[0] * 100,1)#公立/民营医院儿科医生招聘职称要求百分比图形绘制
level = ['初级', '中级', '副高', '高级', '不限']
level1 = [27.6, 17.2, 10.5, 2.5, 36.4]
level2 = [25, 8.1, 10.7, 3, 46.6]
level3 = [33.2, 26.3, 10.3, 1.9, 23.7]
bar = Bar("公立/民营医院儿科医生招聘职称要求百分比", width = 600,height=500)
bar.add("平均",level, level1, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("公立医院",level, level2, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
bar.add("民营医院",level, level3, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30, xaxis_rotate=20)
#bar.render('公立/民营医院儿科医生招聘职称百分比.html')
bar.render('公立、民营医院儿科医生招聘职称要求百分比.html')
bar

儿科的工资待遇怎么样?

医生的薪资一般来说是根据工作经验和职称来定的,当然这里排出了其他方面的"shouru"。 从数据可以看出,儿科医生的平均薪资要高于其他科室的医生,达到13328。薪资果然是高啊,看到这我这个小渣渣沉默了。

                                                                å¥½äºï¼ä½ ä¸è¦å说äºï¼çå­ï¼è¡¨æ

mean_salary = all_data.groupby('depType')['salary'].mean().sort_values()#绘制图形   儿科平均工资与其它科室对比
bar = Bar("儿科平均工资与其它科室对比", width = 600,height=400)
bar.add("", mean_salary.index, np.round(mean_salary.values, 0), is_stack=True, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, )
bar.render('儿科平均工资与其它科室对比.html')
bar

各类型单位招聘的儿科平均工资,期中生物药企企业的儿科医生薪资最高,达到17000,其次就是医药企业。所以但看工资水平的话,生物企业和医药企业更有诱惑力。

#"各类型单位儿科平均工资"
all_data[all_data['depType']=='儿科'].groupby('typeText')['salary'].count()#drop删除科研究院的数据
erke_srl =all_data[all_data['depType']=='儿科'].groupby('typeText')['salary'].mean().drop(index='科研院校').sort_values()
erke_srlbar = Bar("各类型单位儿科平均工资", width = 600,height=500)
bar.add("",erke_srl.index, np.round(erke_srl.values, 0), is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, xaxis_rotate=20)
bar.render('各类型单位儿科平均工资.html')
bar

相当工资,医院对学历、职称等要求如何?

在工资水平相同的情况下,公立医院本科的占比要比民营医院高,换句话说你如果是本科毕业的儿科生在公立医院拿到8-10K的概率要比民营医院要大得多。

all_data[(all_data['depType']=='儿科')&(all_data['salary']>8000)&(all_data['salary']<10000)&(all_data['typeText'].isin(['公立医院', '民营医院']))].groupby(['typeText', 'gradeText'])['id'].count()

grade_same1 = np.round(np.array([3, 31, 12, 1, 0]) / (3+31+12+1)*100, 1)
#grade_same1grade_same2 = np.round(np.array([18, 21, 2, 0, 8]) / (18+21+2+8)*100, 1)
grade_same2

#相同工资水平下公立/民营医院对学历的要求百分比(8k-10k)
bar = Bar("相同工资水平下公立/民营医院对学历的要求百分比(8k-10k)", width = 600,height=600)
bar.add("公立医院",grade, grade_same1, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30)
bar.add("民营医院", grade, grade_same2, is_stack=False, xaxis_label_textsize=20, yaxis_label_textsize=14, is_label_show=True, legend_top=30)
bar

各地方省市对儿科医生的需求

从上面分析可知,全国范围内共有2359个儿科医生招聘岗位,通过进一部分析可知,广东省儿科招聘岗位最大,其次是北京、上海、江苏、浙江等经济发达地区。

# 对于province的处理结果还不是很满意,再处理以下
def get_province(data):province = ['北京', '天津', '河北', '山西', '内蒙古', '辽宁', '吉林', '黑龙江', '上海', '江苏', '浙江', '安徽', '福建', '江西', '山东', '河南', '湖北', '湖南', '广东', '广西', '海南', '重庆', '四川', '贵州', '云南', '西藏', '陕西', '甘肃', '青海', '宁夏', '新疆', '台湾', '香港', '澳门', '国外']for i in province:if i in data:return i
all_data.loc[all_data['depType']=='儿科', 'province2'] = all_data.loc[all_data['depType']=='儿科', 'locationText'].apply(get_province)
#all_data['province2']demand = all_data.loc[all_data['depType']=='儿科', 'province2'].value_counts()
demand

儿科医生的要求和福利

儿科医生的要求也进一步进行分类如儿科护士长、新生儿科、儿科临床医师。薪资福利有五险一金、房贴、工作餐、带薪年假。

from collections import Counter
from pyecharts import WordCloudg = all_data.loc[all_data['depType']=='儿科', 'gradeText'].value_counts()
y = all_data.loc[all_data['depType']=='儿科', 'jobYearText'].value_counts()l = all_data.loc[all_data['depType']=='儿科', 'levelText'].value_counts()
n = all_data.loc[all_data['depType']=='儿科', 'name'].value_counts()
p = all_data.loc[all_data['depType']=='儿科', 'positText'].value_counts()
t = all_data.loc[all_data['depType']=='儿科', 'typeText'].value_counts()welfare= []
for i in all_data.loc[all_data['depType']=='儿科', 'welfare']:if len(i) > 0:welfare.extend(i)
w = pd.Series(Counter(welfare))
all = pd.concat([g, y, l, n, p, t, w])name, value = all.index, all.values
wordcloud = WordCloud(width=800, height=800)
wordcloud.add("", name, value, word_size_range=[20, 80])
wordcloud

总结

通过以上分析可知,儿科以上在薪资、福利待遇是个不错的行业,但是它对职称和工作经验也有较高的要求。民营医院的招聘要求要更严格一些,生物企业、医药企业薪资更加诱惑。

大家看了有感兴趣的需要具体代码的可以私下交流,也希望各位能多多提供些宝贵意见。

这篇关于儿科医生在国内需求分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/377533

相关文章

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

衡石分析平台使用手册-单机安装及启动

单机安装及启动​ 本文讲述如何在单机环境下进行 HENGSHI SENSE 安装的操作过程。 在安装前请确认网络环境,如果是隔离环境,无法连接互联网时,请先按照 离线环境安装依赖的指导进行依赖包的安装,然后按照本文的指导继续操作。如果网络环境可以连接互联网,请直接按照本文的指导进行安装。 准备工作​ 请参考安装环境文档准备安装环境。 配置用户与安装目录。 在操作前请检查您是否有 sud

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号

【软考】希尔排序算法分析

目录 1. c代码2. 运行截图3. 运行解析 1. c代码 #include <stdio.h>#include <stdlib.h> void shellSort(int data[], int n){// 划分的数组,例如8个数则为[4, 2, 1]int *delta;int k;// i控制delta的轮次int i;// 临时变量,换值int temp;in

三相直流无刷电机(BLDC)控制算法实现:BLDC有感启动算法思路分析

一枚从事路径规划算法、运动控制算法、BLDC/FOC电机控制算法、工控、物联网工程师,爱吃土豆。如有需要技术交流或者需要方案帮助、需求:以下为联系方式—V 方案1:通过霍尔传感器IO中断触发换相 1.1 整体执行思路 霍尔传感器U、V、W三相通过IO+EXIT中断的方式进行霍尔传感器数据的读取。将IO口配置为上升沿+下降沿中断触发的方式。当霍尔传感器信号发生发生信号的变化就会触发中断在中断

kubelet组件的启动流程源码分析

概述 摘要: 本文将总结kubelet的作用以及原理,在有一定基础认识的前提下,通过阅读kubelet源码,对kubelet组件的启动流程进行分析。 正文 kubelet的作用 这里对kubelet的作用做一个简单总结。 节点管理 节点的注册 节点状态更新 容器管理(pod生命周期管理) 监听apiserver的容器事件 容器的创建、删除(CRI) 容器的网络的创建与删除

PostgreSQL核心功能特性与使用领域及场景分析

PostgreSQL有什么优点? 开源和免费 PostgreSQL是一个开源的数据库管理系统,可以免费使用和修改。这降低了企业的成本,并为开发者提供了一个活跃的社区和丰富的资源。 高度兼容 PostgreSQL支持多种操作系统(如Linux、Windows、macOS等)和编程语言(如C、C++、Java、Python、Ruby等),并提供了多种接口(如JDBC、ODBC、ADO.NET等

OpenCV结构分析与形状描述符(11)椭圆拟合函数fitEllipse()的使用

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C++11 算法描述 围绕一组2D点拟合一个椭圆。 该函数计算出一个椭圆,该椭圆在最小二乘意义上最好地拟合一组2D点。它返回一个内切椭圆的旋转矩形。使用了由[90]描述的第一个算法。开发者应该注意,由于数据点靠近包含的 Mat 元素的边界,返回的椭圆/旋转矩形数据