第五名专题

人社大赛算法赛题解题思路分享+第五名

关联比赛:  [国家社保]全国社会保险大数据应用创新大赛 赛题背景分析及理解   本次比赛,“精准社保”的赛题为“基本医疗保险医疗服务智能监控”,由参赛队完成数据算法模型的开发设计,实现对各类医疗保险基金欺诈违规行为的准确识别。  在进行了初步数据探索性分析后,总结了本次比赛数据的几个特点: - 数据层次有三层: 1)人 df_id_train, df_id_test 2)单据 d

[第五名公共排行榜] LGB 连续学习 + Catboost 集成

大家好, 首先,我想感谢竞赛组织者和所有参与讨论的人。这是@ibazhov和我在Kaggle上的第一次正式比赛,我们学到了很多,并希望未来能参与更多的比赛。 总结: 使用5个LGB模型进行连续更新/学习,通过.train(init_model)和.refit()方法,以及5个基于216个特征的Catboost模型。通过减去指数贡献的加权和进行后处理,使得w_i * targ_i ≈ 0。