2024全国大学生数据统计与分析竞赛B题【电信银行卡诈骗的数据分析】思路详解

本文主要是介绍2024全国大学生数据统计与分析竞赛B题【电信银行卡诈骗的数据分析】思路详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

电信诈骗是指通过电话、网络和短信方式,编造虚假信息,设置骗局,对受害人实施远程、非接触式诈骗,诱使受害人打款或转账的犯罪行为,通常以冒充他人及仿冒、伪造各种合法外衣和形式的方式达到欺骗的目的,如冒充公检法、商家公司厂家、诈骗。国家机关工作人员、银行工作人员等各类机构工作人员,伪造和冒充招工、婚恋、贷款、中奖、手机定位和招嫖等形式进行。近年来,在党和国家的领导下,公安部门聚焦人民群众深恶痛绝的电信网络诈骗,全面加强“四专两合力”建设,组织全国的公安机关深入推进打防管控各项工作,有效遏制了案件快速上升势头,有力维护了人民群众合法权益。
当前,电信网络诈骗犯罪形势依然严峻,刷单返利、虚假网络投资理财、虚假网络贷款、冒充电商物流客服、冒充公检法、虚假征信等 10 种常见诈骗类型发案占比近 80%,其中刷单返利类诈骗发案率最高,占发案的三分之一左右,虚假网络投资理财类诈骗造成损失的金额最大,占造成损失金额的三分之一左右。附件中提供了 100 万条使用电信银行卡交易的相关数据。
请你们团队使用附件中的相关数据,进行数据统计与分析,回答下列问题:
问题一:请绘制附件中“有无发生电信银行卡诈骗”比例的扇形图,并绘制发生电信银行卡诈骗的案例中,“线上”和“线下”发生电信诈骗数量的柱状图。

精力有限,以下只是简略的图文版初步思路,更详细的视频版完整讲解请移步:

2024全国大学生数据统计与分析竞赛选题建议及详细思路!_哔哩哔哩_bilibili

问题一:

1. 绘制“有无发生电信银行卡诈骗”比例的扇形图

步骤

§ 读取数据集,提取“Fraud”列。

§ 计算“Fraud”列中1和0的比例。

§ 使用饼图绘制诈骗比例。

代码编写:

完整思路讲解:

数模陪跑:2024全国数据统计与分析竞赛更新汇总贴1 赞同 · 0 评论文章

2. 绘制“线上”和“线下”发生电信诈骗数量的柱状图

步骤

§ 筛选出Fraud列为1的数据,分别统计Online列中1和0的数量。

§ 使用柱状图绘制线上和线下的诈骗数量。

代码编写:

问题二:请通过数据分析发生电信诈骗的案例中,“是否使用银行卡在设备上进行转账交易”和“是否使用银行卡的 pin 号码进行转账交易”的指标,判断哪种情况更容易发生电信诈骗?使用银行卡的pin 号码是否可以减少被骗概率?
问题三:请分析所有发生电信诈骗的案例中,哪些指标与是否发生电信诈骗有较强的相关性?“银行卡转账交易是否发生在同一银行”和“是否是线上的银行卡转账交易”是否与电信银行卡诈骗有显著的关联性?

问题二:

1. 分析“是否使用银行卡在设备上进行转账交易”和“是否使用银行卡的pin号码进行转账交易”与电信诈骗的关联性

步骤

§ 提取数据中Card和Pin列,结合Fraud列,统计不同情况下的诈骗比例。

§ 比较两种情况下的诈骗比例,判断哪种情况更容易发生电信诈骗。

问题三:

1. 分析哪些指标与是否发生电信诈骗有较强的相关性

步骤

§ 计算所有指标与Fraud列之间的相关系数。

§ 选择相关系数较大的指标进行分析。

2. 分析“银行卡转账交易是否发生在同一银行”和“是否是线上的银行卡转账交易”与电信诈骗的关联性

步骤

§ 分别计算Repeat和Online与Fraud的相关性。

代码编写:

问题四:请分析附件中所有的指标数据,选取合适的指标,建立“电信银行卡诈骗的预测模型”,并选取合适的训练集和测试集,计算预测模型的准确率。为了降低电信诈骗的概率,保护人们的财产安全,请基于你们团队数据分析的结果,分别给公安部门、银行和市民们提出你们的建议。

问题四:

1. 建立“电信银行卡诈骗的预测模型”

步骤

§ 数据预处理:处理缺失值、标准化数据等。

§ 特征选择:选择相关性较高的特征。

§ 划分训练集和测试集。

§ 选择模型:如逻辑回归、决策树等。

§ 训练模型并评估准确率。

OK,上述思路的文档领取、视频讲解以及后续的完整成品论文预定请点击我的下方个人卡片查看↓:

这篇关于2024全国大学生数据统计与分析竞赛B题【电信银行卡诈骗的数据分析】思路详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/1044047

相关文章

详解nginx 中location和 proxy_pass的匹配规则

《详解nginx中location和proxy_pass的匹配规则》location是Nginx中用来匹配客户端请求URI的指令,决定如何处理特定路径的请求,它定义了请求的路由规则,后续的配置(如... 目录location 的作用语法示例:location /www.chinasem.cntestproxy

kotlin中const 和val的区别及使用场景分析

《kotlin中const和val的区别及使用场景分析》在Kotlin中,const和val都是用来声明常量的,但它们的使用场景和功能有所不同,下面给大家介绍kotlin中const和val的区别,... 目录kotlin中const 和val的区别1. val:2. const:二 代码示例1 Java

CSS will-change 属性示例详解

《CSSwill-change属性示例详解》will-change是一个CSS属性,用于告诉浏览器某个元素在未来可能会发生哪些变化,本文给大家介绍CSSwill-change属性详解,感... will-change 是一个 css 属性,用于告诉浏览器某个元素在未来可能会发生哪些变化。这可以帮助浏览器优化

Python基础文件操作方法超详细讲解(详解版)

《Python基础文件操作方法超详细讲解(详解版)》文件就是操作系统为用户或应用程序提供的一个读写硬盘的虚拟单位,文件的核心操作就是读和写,:本文主要介绍Python基础文件操作方法超详细讲解的相... 目录一、文件操作1. 文件打开与关闭1.1 打开文件1.2 关闭文件2. 访问模式及说明二、文件读写1.

详解C++中类的大小决定因数

《详解C++中类的大小决定因数》类的大小受多个因素影响,主要包括成员变量、对齐方式、继承关系、虚函数表等,下面就来介绍一下,具有一定的参考价值,感兴趣的可以了解一下... 目录1. 非静态数据成员示例:2. 数据对齐(Padding)示例:3. 虚函数(vtable 指针)示例:4. 继承普通继承虚继承5.

前端高级CSS用法示例详解

《前端高级CSS用法示例详解》在前端开发中,CSS(层叠样式表)不仅是用来控制网页的外观和布局,更是实现复杂交互和动态效果的关键技术之一,随着前端技术的不断发展,CSS的用法也日益丰富和高级,本文将深... 前端高级css用法在前端开发中,CSS(层叠样式表)不仅是用来控制网页的外观和布局,更是实现复杂交

Python获取中国节假日数据记录入JSON文件

《Python获取中国节假日数据记录入JSON文件》项目系统内置的日历应用为了提升用户体验,特别设置了在调休日期显示“休”的UI图标功能,那么问题是这些调休数据从哪里来呢?我尝试一种更为智能的方法:P... 目录节假日数据获取存入jsON文件节假日数据读取封装完整代码项目系统内置的日历应用为了提升用户体验,

Linux换行符的使用方法详解

《Linux换行符的使用方法详解》本文介绍了Linux中常用的换行符LF及其在文件中的表示,展示了如何使用sed命令替换换行符,并列举了与换行符处理相关的Linux命令,通过代码讲解的非常详细,需要的... 目录简介检测文件中的换行符使用 cat -A 查看换行符使用 od -c 检查字符换行符格式转换将

Go标准库常见错误分析和解决办法

《Go标准库常见错误分析和解决办法》Go语言的标准库为开发者提供了丰富且高效的工具,涵盖了从网络编程到文件操作等各个方面,然而,标准库虽好,使用不当却可能适得其反,正所谓工欲善其事,必先利其器,本文将... 目录1. 使用了错误的time.Duration2. time.After导致的内存泄漏3. jsO

详解C#如何提取PDF文档中的图片

《详解C#如何提取PDF文档中的图片》提取图片可以将这些图像资源进行单独保存,方便后续在不同的项目中使用,下面我们就来看看如何使用C#通过代码从PDF文档中提取图片吧... 当 PDF 文件中包含有价值的图片,如艺术画作、设计素材、报告图表等,提取图片可以将这些图像资源进行单独保存,方便后续在不同的项目中使