清华韩亦舜:大数据革命与新经济分析

2023-11-05 20:30

本文主要是介绍清华韩亦舜:大数据革命与新经济分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


0?wx_fmt=jpeg


 ◆ 


导读:本讲座为清华大学数据科学研究院执行副院长韩亦舜于2016年7月14日在首届中国大数据应用大会上所做的题为《大数据革命与新经济分析》的演讲。


0?wx_fmt=png

0?wx_fmt=png


 ◆ 


我们研究经济的时候,一定会放眼世界看更大的版图,因为今天的中国已经是世界第二大经济体了。看这张图的时候大家想一想,如果没有互联网,我们不可能及时地看到这个世界。80年代,电话开始进入了普通中国家庭。但是数量还是很少,通讯基本还是靠书信。现在信息发展非常快,这就要求我们思考:当我们放眼世界的时候,以什么样的思想和工具观察这个世界?


0?wx_fmt=png

0?wx_fmt=png

0?wx_fmt=png

0?wx_fmt=png


这些大数据的发展历程大家已经耳熟能详了。大数据分析未来的发展趋势是:数据将应用于社会化的分析,工具会越来越灵活;越来越多的人借助可视化方法来表现数据魅力,可视化做好以后数据会有美感方面的创新。数据的搜集将不但来自特定机构的数据,也来自老百姓的无私奉献。我们知道,每个人在网上随便一个动作都能留下很多痕迹,特别是当有些机制会让民众以很自然的方式参与公共数据的采集,这会减少政府维护基础设施的成本,也让市民有很好的参与感。大数据叠加上互联网、云计算,会带来新机遇。



0?wx_fmt=png

0?wx_fmt=png


今天我希望讲一讲大数据和经济分析的关系,过去我们有宏观经济、微观经济,今后经济研究领域会越来越注重用数据说话,数据会给我们呈现什么东西呢?


关于大数据只重视相关性不重视因果性,这个说法有片面性。数据表明海盗数量减少和全球气候变暖高度相关,可这有什么用?我们不能把全球气温抬高来遏制海盗数量。人类现在的思维水平更多地可能还是愿意找一些因果关系才能重复使用,包括结构化和非结构化,目前很多科学家做的努力都是把非结构化的数据结构化或半结构化,就是因为目前我们的认知水平多数还是用结构化的方式处理更有效和更习惯。


0?wx_fmt=png


我们尝试用大数据处理手段做行业分析,开发出一些行业指数。这些数据一定不是交易数据的全部,但是经过持续采集、连续分析,当它作为一个行业指数来说还是有比较好的参考价值的。这里面我们着重做了一些行业相关的指数。今天我说的数据主要来自银联刷卡数据,它有一定的代表性。当然第一,大家知道外国的卡不归它管;第二,现金交易不归它管,第三方支付也拿不到数据,所以采集到的数据仍然不是全面数据。但即便不是全面数据也可以呈现出一些比较有趣的现象。


0?wx_fmt=png


这是房地产数据,虽然和传统统计方式不太一样,它确实呈现出与国家统计局公布的数据拟合度很高的情形。而且,我们的实时性很强,这些数据对于一些想提前知道经济状况,想提前对经济进行预测的金融机构还是有很大价值的。


0?wx_fmt=png


这是一个高端酒店的行业数据,这是以2011年的数据做基准,黄色的曲线可以看出它的起伏。灰色的竖道是环比增长情况。


0?wx_fmt=png

0?wx_fmt=png


这里面有三个数,一个是餐饮指数增长增速,一个是酒店增速,和各省GDP的增速。里面可以看到全部是深红色的地方是西藏这个地方,酒店指数这块——青海、新疆发展很快,包括贵州、广西也都发展得比较快。在整个沿海地区呈现出相对发展较慢的情况,但是那边的经济并不是想象的那么差,只不过它的餐饮业酒店业饱和度比较高,所以就没有呈现出那么好的增长趋势。


0?wx_fmt=png


这张图说明了什么?刚才介绍了几本书,其中讲到了区域相关性,我们有几个大的经济区域,它们之间存在着什么样的经济关系,我们也用手上的数据进行分析,呈现出类似一些情况。


0?wx_fmt=png

前不久我们做了一个大数据交流会,和韩国的学者一起交流。我们利用跨境交易数据做了统计,2013年—2015年跨境交易金额数据香港第一,澳门第二,韩国从2014年的第三掉到2015年的第五,2015年日本从后面又赶上来了,这是不是背后有可以解释或者暂时不能解释的原因?另外是交易笔数,香港第一,到2015年韩国第二,日本第三,这说明什么呢?说明在韩国买的都是小件东西,所以交易笔数多但是金额不多,在日本买的都是大件东西,交易笔数相对少一点,但是交易总额多一些。这就是我想说的,有的时候当你利用手上一部分数据,分析它会发现一些比较奇特的现象。



0?wx_fmt=png


这个是日韩跨境消费数据,主要集中在珠宝百货与美容行业,韩国珠宝类的交易几乎不太多,特别突出的是韩国行业的美容,这个和大家的认知差不多,很多人去韩国购买深度或者浅层的美容服务,但是在那儿买珠宝的很少。我们展示这个数据并和韩国学者交流,他们承认他们的珠宝类产业不够发达,据说和他们国家的珠宝加工水平不高有关,这些数据是不是反过来指出规划产业的时候在这些略有不足的地方存在发展空间,这对他们也有指导意义。


0?wx_fmt=png


这是中日韩消费经济呈现区域引力效应图,竖向是在几地的消费,横向是三个月后又在这些地方消费。红色的框是三个月出现在香港消费,三个月又出现在香港消费的比较多,泰国只有百分之七点多,法国百分之八点几,瑞士只有百分之四,美国有百分之二十多,其中是什么原因不敢轻易下结论。这里面有几个蓝框,讲区域引力效应,香港和澳门框的比例相对高一些,日本和韩国的框整体又是在百分之十几以上,另外就是法国和瑞士,前面讲的几本书,其中有一本讲到了区域经济引力,相邻地区或者风格相近的地方因为对彼此的风格很认同,所以愿意再去。如果我们对这种问题一探究竟会很有趣,比如为什么去过香港以后去澳门就多一些,这些都可以做一些深入探讨。


0?wx_fmt=png

0?wx_fmt=png

原文发布时间为:2016-08-07

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

这篇关于清华韩亦舜:大数据革命与新经济分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/352319

相关文章

Java中注解与元数据示例详解

《Java中注解与元数据示例详解》Java注解和元数据是编程中重要的概念,用于描述程序元素的属性和用途,:本文主要介绍Java中注解与元数据的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参... 目录一、引言二、元数据的概念2.1 定义2.2 作用三、Java 注解的基础3.1 注解的定义3.2 内

将sqlserver数据迁移到mysql的详细步骤记录

《将sqlserver数据迁移到mysql的详细步骤记录》:本文主要介绍将SQLServer数据迁移到MySQL的步骤,包括导出数据、转换数据格式和导入数据,通过示例和工具说明,帮助大家顺利完成... 目录前言一、导出SQL Server 数据二、转换数据格式为mysql兼容格式三、导入数据到MySQL数据

C++中使用vector存储并遍历数据的基本步骤

《C++中使用vector存储并遍历数据的基本步骤》C++标准模板库(STL)提供了多种容器类型,包括顺序容器、关联容器、无序关联容器和容器适配器,每种容器都有其特定的用途和特性,:本文主要介绍C... 目录(1)容器及简要描述‌php顺序容器‌‌关联容器‌‌无序关联容器‌(基于哈希表):‌容器适配器‌:(

C#提取PDF表单数据的实现流程

《C#提取PDF表单数据的实现流程》PDF表单是一种常见的数据收集工具,广泛应用于调查问卷、业务合同等场景,凭借出色的跨平台兼容性和标准化特点,PDF表单在各行各业中得到了广泛应用,本文将探讨如何使用... 目录引言使用工具C# 提取多个PDF表单域的数据C# 提取特定PDF表单域的数据引言PDF表单是一

一文详解Python中数据清洗与处理的常用方法

《一文详解Python中数据清洗与处理的常用方法》在数据处理与分析过程中,缺失值、重复值、异常值等问题是常见的挑战,本文总结了多种数据清洗与处理方法,文中的示例代码简洁易懂,有需要的小伙伴可以参考下... 目录缺失值处理重复值处理异常值处理数据类型转换文本清洗数据分组统计数据分箱数据标准化在数据处理与分析过

大数据小内存排序问题如何巧妙解决

《大数据小内存排序问题如何巧妙解决》文章介绍了大数据小内存排序的三种方法:数据库排序、分治法和位图法,数据库排序简单但速度慢,对设备要求高;分治法高效但实现复杂;位图法可读性差,但存储空间受限... 目录三种方法:方法概要数据库排序(http://www.chinasem.cn对数据库设备要求较高)分治法(常

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

Linux使用dd命令来复制和转换数据的操作方法

《Linux使用dd命令来复制和转换数据的操作方法》Linux中的dd命令是一个功能强大的数据复制和转换实用程序,它以较低级别运行,通常用于创建可启动的USB驱动器、克隆磁盘和生成随机数据等任务,本文... 目录简介功能和能力语法常用选项示例用法基础用法创建可启动www.chinasem.cn的 USB 驱动