科赛专题

科赛网 魔镜杯“风控算法比赛”赛后总结

1.问题描述 从平均400个数据维度来评估当前用户的信用状态,给每个借款人打出当前状态的信用分。在此基础上,再结合新发标的信息,打出对于每个标的6个月内逾期率的预测,为投资人提供了关键的决策依据,促进健康高效的互联网金融。 2.数据集 数据是国内网络借贷行业的贷款风险数据,包括信用违约标签(因变量)、建模所需的基础与加工字段(自变量)、相关用户的网络行为原始数据。数据下载地址: Maste

科赛——【文本情感分类模型搭建 | 预选赛】(Score:0.8624)

预选赛题——文本情感分类模型 Data Analysis 先来观察下数据,训练集和测试集分别存储在当前目录下的train.csv和20190520_test.csv中 train_data = pd.read_csv('train.csv', lineterminator='\n') # 行分隔符 = '\n'test_data = pd.read_csv('20190520_test

科赛网新人赛-员工满意度预测 MSE 0.02882

科赛网新人赛-员工满意度预测 - 竞赛思路 原贴地址项目地址 文章目录 科赛网新人赛-员工满意度预测 - 竞赛思路有用的资料、文档、博客环境与工具1.0 基础知识1.1 数据挖掘流程: 2.0 数据探索性分析2.1 单变量分析2.2 多变量分析 3.0 特征工程3.1 特征创建3.1.1 笛卡尔积特征创建3.1.2 使用 number_project 对 average_month

【科赛网15天培训】前期准备

选择错题 #[题目链接](https://www.icourse163.org/learn/NJU-1001571005?tid=1002701006#/learn/ojhw?id=1003423011)def find_person(dict_users, strU):if strU in dict_users:return dict_users[strU]else:re

百度×科赛 PaddlePaddle AI 大赛开赛啦

2017年12月28日,百度 PaddlePaddle AI 大赛正式开赛了! 在上篇「百度和科赛,想让AI与你更近一些」中曾提到,PaddlePaddle AI 大赛“希望参赛选手使用PaddlePaddle深度学习框架、利用BROAD数据集、利用K-Lab,着手解决一些行业中的真实问题,从而让AI真正应用于行业、服务于行业。” 本次大赛,我们将目光放在这样一个行业——电视综艺。 在电

数据分析 NO.14 科赛网Pandas练习题

Pandas练习题 知识点: 练习一: df=pd.read_csv( ) df[“item_name”].value_counts() 对item_name计数 df[“item_name”].unique() 列出item_name不重复的数据 df[“item_name”].nunique() 列出item_name不重复的数据的个数!! 1.将item_price转换为浮点数: do

科赛——【文本情感分类模型搭建 | 练习赛】(咸鱼的划水之路~Score:0.813)

数据分析 先来观察下数据,训练集和测试集分别存储在当前目录下的train.csv和test.csv中 train_data = pd.read_csv('train.csv', lineterminator='\n')test_data = pd.read_csv('test.csv', lineterminator='\n')train_data.head(10) 输出: 数据处

深度之眼AI自媒体联合科赛平台银行客户二分类算法比赛参赛经验分享

比赛简介 近段时间参加了"深度之眼"联合"科赛"推出的银行客户二分类算法比赛,在“深度之眼”指导李老师的视频教学指导下,有幸复现出baseline。这里首先感谢平台和李老师。比赛链接:「二分类算法」提供银行精准营销解决方案。 赛题描述 数据集:选自UCI机器学习库中的「银行营销数据集(Bank Marketing Data Set)」 这些数据与葡萄牙银行机构的营销活动相关。这些营销