电子科大周涛:半路出家的物理人怎么玩转大数据和AI | 上海市北·GMIS

本文主要是介绍电子科大周涛:半路出家的物理人怎么玩转大数据和AI | 上海市北·GMIS,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

大数据文摘出品

记者:时慧、毅航

 

上海市北·GMIS全球人工智能峰会在7月20日这天迎来了电子科技大学周涛教授。

 

本次讲座,周教授虽自谦理论物理出身、只是半路出家,但他用丰硕的项目成果和深入浅出的幽默语言,展示了大数据和AI如何推动治理和监管的革命。

 

基于街景的城市感知

 

如何利用街景来感知我们的城市,助力城市管理?

 

针对这个问题,周教授团队做了一个有趣的实验。实验选取2000张google街景图片,在网站上征集志愿者参与,判断两张照片里的街景哪个看起来更安全。

 

实验将采集的50多万个标注数据进行排序,再把得到的list给map到[0,1]的空间上,更高的分数表示更安全,从而得到训练集。训练好的系统可以对新的街景照片打分,判断安全程度。计算机打分的数据与真人打分进行比对,其有效性得到了验证。

 

接着实验进一步延伸,借助系统判断城市中的某一处街区在5至10年的发展变化,通过比较街区前后分数变化可以判断街区是否更美好了。由此,城市建设和管理水平得到有效评估。

 

 

通过对图片分析,还可以发现贫民窟。现实社会是,贫民窟的面积和范围比我们想象的还大,而且,政府也可以利用该系统评判自己花出去的改善民生的钱有没有用到实处,亦或只是赢得属下的马屁而沾沾自喜。

 

基于行为数据的金融监管

 

面对中小科技企业因没有抵押物而贷款难的问题,周教授团队开发了针对企业征信、信贷的产品——信易贷。

 

它的商业模型很简单,就是小微企业申请贷款,通过模型判断分数;之后政府贴息、并开放一些数据,比如税收,公积金等等;然后担保机构就进行担保征信,其他的资金方再来放钱。

 

信易贷的数据来源分四类。第一类是行为数据,举个例子,比如说一个企业可能会存在诉讼的问题,全中国有300多家地级别法院,周教授爬虫爬取法院历年来涉及诉讼的信息,通过查看企业是否有大量合同欺诈诉讼和仲裁案件,来评估借贷的风险性。

 

招聘信息也是企业行为数据的重要组成。作为一个互联网企业,可能多家招聘网站上都有招聘信息,招多少人,招什么职位,平均薪水如何,有没有公司的人已经在修改简历等等。这些数据虽然是公开的,但却很有用。如果推断出企业员工数在大幅度的萎缩,有人在离职,那么可以进一步评估出此企业信用等级较低。以上涉及到的是企业在发展过程中形成的大量行为数据,基于这些行为数据,实现针对中小科技企业的金融监管。

 

此外,企业投资关系网数据也值得探究,基于这些数据我们看出其中的异常关系。比如一个企业可能是A企业,全资控股B,B全资控制C,C全资控股D,D全资控股A。那A投了B之后,A再把其股东的股份转给B,如果有这样的关系他有什么样的好处呢?如果一个亿的现金正常给到B作为注册资本,B给C,然后C给D,但是D又给A,这样来回转,四家公司都有一个亿的注册资本,这样公司就可以申请很多资质,比如做集采,建筑,甚至做P2P的行业。如果有20个亿,在今天成立了一家公司,老百姓认为公司账户有20个亿,然后给公司投钱,受害的还是老百姓。这种公司可以在成都做一遍,然后又移到南京去,最后到上海。凡是有这种循环结构的,80%都有问题。

 

 

立体化的环境治理

 

周教授还用大数据人工智能的方法来做空天一体化的环境治理。

 

 

面对水域治理时有这样几个痛点问题:第一,无法对大水域做治理。比如四川省的水资源非常丰富,同时水资源丰富的地方往往经济落后。因为政府没有足够多的钱去安装足够多的监测站监测大水域。于是周教授想到利用遥感航拍,拍摄水域全景图,对水域管理情况进行打分。第二个问题是无法实时获得水域治理情况。当发现疑似问题,需要再用无人机确认一下。第三,当出现大型的污染事件,比如一个河道中有大量的污染物,此时要立刻判断要不要向上游借水把污染物冲到下游城市,那么污染处就安全了。再考虑借多少水,因为成本高,需要实时知道污染物的情况,甚至进行扩散动力学分析。

 

周教授的项目涉及成都22个区市县,它的难点主要是去云,而不是机器学习。“我们过去发现这些泥沙的污染,黑臭水体等等,这个主要是用遥感”,周教授做了一个设备,“这个设备只有3公斤重,可以放无人船上,造价只有一点点钱,但是卖给政府非常非常贵,这个本来可以更便宜一点。”设备的灵感来自于遥感,现在大概5-10秒钟一个读数。

该设备可以超过国控站的误差水平。做环保治理的时候,可以拿着手持设备,10秒钟就获得读数。如果有一个移动设备,比如三公里河或者一个大湖,只要一艘船来回反复的开,就能知道每个排污口排的东西,过多长时间对下面的影响有多大。这个是以前绝对做不到的。

 

大气也是类似的,相较于水体稍微难一点,周教授用的方法是用出租车在北京、成都跑,通过安装设备,来避免原来站点的监测精度不够,它可以用机器学习的方式进一步的提高精度。或者是去找到城市的绿地、水面、建筑、人口密度、车辆密度,找到这些变量和污染的关系。精度大概是一千米乘一千米,进而知道污染情况。

 

 

下面展示成都某地的示例,城市管理者可以借此管理工业企业,能知道如果关闭了某一家企业,或者把用工时间从平常移到周末,或者白天移到晚上,会带来什么影响,这样就避免环保部的一刀切,实现精确可控。

 

在最后,周教授感慨道,以前讲监管,讲治理,本质上是一个人的行为,人的行为会带来很多误差,有的误差是中国的政治体制本身带来的,所以有一些话大家不敢说,不好说,老百姓的问题不好向上面反应,或者花了很多钱没有起到效果。但是现在随着一些技术突破,我们完全可以在50公分,甚至30公分的精度用遥感看城市,所以城市的发展企业行为,人的行为记录了大量的数据,使得观察和判断越来越准确化。所以周教授认为治理和监管将会有四方面特别大的变化,会变得自动化,规模化,定量化和客观化。

 

这篇关于电子科大周涛:半路出家的物理人怎么玩转大数据和AI | 上海市北·GMIS的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/177558

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

W外链微信推广短连接怎么做?

制作微信推广链接的难点分析 一、内容创作难度 制作微信推广链接时,首先需要创作有吸引力的内容。这不仅要求内容本身有趣、有价值,还要能够激起人们的分享欲望。对于许多企业和个人来说,尤其是那些缺乏创意和写作能力的人来说,这是制作微信推广链接的一大难点。 二、精准定位难度 微信用户群体庞大,不同用户的需求和兴趣各异。因此,制作推广链接时需要精准定位目标受众,以便更有效地吸引他们点击并分享链接

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统