【K哥爬虫普法】二十五岁 人大本硕 腾讯在职 爬虫被捕!

2024-03-06 18:12

本文主要是介绍【K哥爬虫普法】二十五岁 人大本硕 腾讯在职 爬虫被捕!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。

上一期普法栏目,给大家讲了一个博士爬虫被捕的案例。

学历≠人品

无独有偶,今天的故事主角也是大家眼中的高材生。

只可惜,进去咯。

案情回顾

2023年7月1日,中国人民大学校内树洞“小喇叭”爆料了一个叫做“RUC IR FACE”的网站。

该网站把人民大学全校学生的照片和个人信息列了出来,并进行了颜值打分。

图片

不仅仅是照片,甚至还包括了姓名、学号、照片、生日、籍贯、身高等个人信息,而且涵盖了人民大学16-20级本硕博的学生资料。

图片

此事一出,在校内迅速激起千层浪,也有同学找到一些网络博主投稿爆料此事。

图片

7月2日,中国人民大学学校对此事做出回应称,学校已关注到此事,已经第一时间联系警方,后续将积极配合警方处理。

7月3日,央视新闻报道,海淀警方已将嫌疑人马某依法拘留,马某的信息也开始浮出水面。

据爆料,马某是中国人民大学信息学院的15级本科生,高瓴学院硕士生,在校期间曾获评校三好学生、优秀团干部,还获得国家奖学金,并成功保研

同学评价他在学术领域很厉害,在校期间参加过众多项目,代码能力很强,对技术很有热情,是“信息学院大佬”。

被拘留之前就职于腾讯微信事业群算法部门。

但这哥们儿虽说学历高,能力强,爱好却不怎么高级,学习工作之余,还喜欢点儿小颜色

出事后就被扒出曾在Github上发布过用AI给“小姐姐一键脱衣”的源码。

其实这都只能算恶趣味,但直到2020年,着手制作“RUC IR FACE”打分网站,自此走上了违法犯罪的道路,酿成大错。

图片

图片

然而,这么多的学生信息被盗,到底是学校的信息系统没有相应的反爬措施,还是因为马某能进后台,目前犹未可知。

但我觉得,人大的信息系统即使有应对手段,也是防的住君子防不住小人。

要知道,现在大学生的隐私泄露程度是相当高的。

给大家插一个题外笑话,我在知乎上看过一个问题“你见过最烂的代码长什么样子?”

其中有一个回答如下:

图片

钥匙,就藏在门前的地毯下!XD

这也从侧面反映了高校信息系统安全性的薄弱。

一方面,高校的信息系统安全确实应该加强,做好安全措施,保护学生的信息安全。

另一方面,懂爬虫技术的兄弟们也应当时刻谨记,无论网站是否做了反爬措施,未经授权爬取网页信息都是违法的,不能说人家不关门,你就随便往别人家里进。

相关法条

刑法《第二百八十五条》

  • 【非法侵入计算机信息系统罪】违反国家规定,侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的,处三年以下有期徒刑或者拘役。

  • 【非法获取计算机信息系统数据、非法控制计算机信息系统罪】违反国家规定,侵入前款规定以外的计算机信息系统或者采用其他技术手段,获取该计算机信息系统中存储、处理或者传输的数据,或者对该计算机信息系统实施非法控制,情节严重的,处三年以下有期徒刑或者拘役,并处或者单处罚金;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。

案件后续

目前马某的最终判决还没下来,但他这可能是出于“好玩儿”的一系列举动,无疑是板上钉钉的犯罪行为,他也终将为自己的行为付出沉重代价。

其实,2003年,在大洋的彼岸,美利坚合众国也有一哥们儿做过类似的事情,说不好马某20年后的行为是不是在效仿他。

美国这哥们儿曾经也是哈佛大学在校生,因为被女朋友甩了,比较emo,于是一怒之下侵入了学校系统,爬取了全校女同学的照片,同时制作了一个网站,访问者可以从两张女生的图片里选出“谁更火辣”。

图片

网站迅速爆火,高点击的同时,也引来了很多人的不满,校方也是紧急进行了处理,但由于当时相关法规的不完善,后来这哥们儿只是遭到了留校察看的处分。

但哈弗这哥们儿后来也没继续念了,因为在第二年,他就创立了Facebook,网站大火,他辍学专心创业去了。

是的,就是后来人称蜥蜴人的脸书CEO 马克·扎克伯格

图片

K言K语

打分,永远是互联网上的流量密码,不知道有没有虎扑JR,懂的都懂哈。

但是随意评论他人外貌,是非常无礼、低劣的行为,除了公众人物,大部分人都不会希望自己被挂在网上供人打分娱乐,评头论足。

再说回开头,学历≠人品,读圣贤书,行腌臜事,实在是令人不齿。

希望大家读了书,都能做一个高尚的、纯粹的、有道德的、脱离了低级趣味的、有益于人民的人

公民个人信息神圣不可侵犯,K哥普法栏目你可得好好看,下次碰上,你就不会被抓啦!

图片

这篇关于【K哥爬虫普法】二十五岁 人大本硕 腾讯在职 爬虫被捕!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/780906

相关文章

Python3 BeautifulSoup爬虫 POJ自动提交

POJ 提交代码采用Base64加密方式 import http.cookiejarimport loggingimport urllib.parseimport urllib.requestimport base64from bs4 import BeautifulSoupfrom submitcode import SubmitCodeclass SubmitPoj():de

Python:豆瓣电影商业数据分析-爬取全数据【附带爬虫豆瓣,数据处理过程,数据分析,可视化,以及完整PPT报告】

**爬取豆瓣电影信息,分析近年电影行业的发展情况** 本文是完整的数据分析展现,代码有完整版,包含豆瓣电影爬取的具体方式【附带爬虫豆瓣,数据处理过程,数据分析,可视化,以及完整PPT报告】   最近MBA在学习《商业数据分析》,大实训作业给了数据要进行数据分析,所以先拿豆瓣电影练练手,网络上爬取豆瓣电影TOP250较多,但对于豆瓣电影全数据的爬取教程很少,所以我自己做一版。 目

AIGC6: 走进腾讯数字盛会

图中是一个程序员,去参加一个技术盛会。AI大潮下,五颜六色,各种不确定。 背景 AI对各行各业的冲击越来越大,身处职场的我也能清晰的感受到。 我所在的行业为全球客服外包行业。 业务模式为: 为国际跨境公司提供不同地区不同语言的客服外包解决方案,除了人力,还有软件系统。 软件系统主要是提供了客服跟客人的渠道沟通和工单管理,内部管理跟甲方的合同对接,绩效评估,BI数据透视。 客服跟客人

Golang 网络爬虫框架gocolly/colly(五)

gcocolly+goquery可以非常好地抓取HTML页面中的数据,但碰到页面是由Javascript动态生成时,用goquery就显得捉襟见肘了。解决方法有很多种: 一,最笨拙但有效的方法是字符串处理,go语言string底层对应字节数组,复制任何长度的字符串的开销都很低廉,搜索性能比较高; 二,利用正则表达式,要提取的数据往往有明显的特征,所以正则表达式写起来比较简单,不必非常严谨; 三,使

Golang网络爬虫框架gocolly/colly(四)

爬虫靠演技,表演得越像浏览器,抓取数据越容易,这是我多年爬虫经验的感悟。回顾下个人的爬虫经历,共分三个阶段:第一阶段,09年左右开始接触爬虫,那时由于项目需要,要访问各大国际社交网站,Facebook,myspace,filcker,youtube等等,国际上叫得上名字的社交网站都爬过,大部分网站提供restful api,有些功能没有api,就只能用http抓包工具分析协议,自己爬;国内的优酷、

Golang网络爬虫框架gocolly/colly(三)

熟悉了《Golang 网络爬虫框架gocolly/colly 一》和《Golang 网络爬虫框架gocolly/colly 二》之后就可以在网络上爬取大部分数据了。本文接下来将爬取中证指数有限公司提供的行业市盈率。(http://www.csindex.com.cn/zh-CN/downloads/industry-price-earnings-ratio) 定义数据结构体: type Zhj

014.Python爬虫系列_解析练习

我 的 个 人 主 页:👉👉 失心疯的个人主页 👈👈 入 门 教 程 推 荐 :👉👉 Python零基础入门教程合集 👈👈 虚 拟 环 境 搭 建 :👉👉 Python项目虚拟环境(超详细讲解) 👈👈 PyQt5 系 列 教 程:👉👉 Python GUI(PyQt5)文章合集 👈👈 Oracle数据库教程:👉👉 Oracle数据库文章合集 👈👈 优

urllib与requests爬虫简介

urllib与requests爬虫简介 – 潘登同学的爬虫笔记 文章目录 urllib与requests爬虫简介 -- 潘登同学的爬虫笔记第一个爬虫程序 urllib的基本使用Request对象的使用urllib发送get请求实战-喜马拉雅网站 urllib发送post请求 动态页面获取数据请求 SSL证书验证伪装自己的爬虫-请求头 urllib的底层原理伪装自己的爬虫-设置代理爬虫coo

腾讯社招面试经历

前提:本人2011年毕业于一个普通本科,工作不到2年。   15号晚上7点多,正在炒菜做饭,腾讯忽然打电话来问我对他们的Linux C++的职位是否感兴趣,我表达了我感兴趣之后,就开始了一段简短的电话面试,电话面试主要内容:C++和TCP socket通信的一些基础知识。之后就问我一道算法题:10亿个整数,随机生成,可重复,求最大的前1万个。当时我一下子就蒙了,没反应过来,何况我还正在烧

完整的腾讯面试经过

从9月10号开始到现在快两个月了,两个多月中,我经历数次面试和笔试,在经历这些的同时积累了不少的经验,也学到了不少东西,在此把它记录下来,算是和一起找工作中的同学一起共勉吧。我是本校的学生,专业是机械制造及其自动化,找工作的主要目标是计算机软件类和机械制造方向的国内的企业,所以意向去外企的同学就不必浪费时间看这些面经啦,想去国内IT企业的同学可以继续看下去。本贴中我把最近的腾讯面试经过写下