一位GIS女博士眼中的空间大数据分析

2024-01-12 04:40

本文主要是介绍一位GIS女博士眼中的空间大数据分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  4D数据是测绘地理信息人的全部吗?答案不应该是肯定的。过去,我们对传统地信企业和部门,尤其是诸如测绘院等传统机构的印象,多停留在地理国情普查等庞大的职能上,我们认为他们应该把握最全面和精确的数据,那么除此之外呢?

    跳出传统测绘地理信息的圈子,以空间数据为基准和尺度的各种数据分析和应用正在爆发。剧变面前,传统地信人正在尝试改变,这种改变能够帮助他们完成从传统数据采集者到数据更好应用者的身份转型。

    在Esri今年召开的用户大会上,记者采访了演讲嘉宾之一——北京测绘设计研究院的关丽博士,这位GIS 出身的女博士正带领团队尝试使用新的空间大数据模型对城市现状进行评估分析,亲历传统测绘地理信息的思路转型,她分享了一些见解,让人眼前一亮。


关丽演讲现场

    全新空间大数据模型服务于城市规划

    北京市测绘设计研究院,是隶属于北京规划委的以测绘地理信息服务为主的综合生产科研单位,拥有地理信息局颁发的一级测绘资质以及建设部颁发的工程勘察证书等多个地理信息服务资格。但是,这个颇具代表性的传统地理信息服务部门,其工作范畴却并不局限于我们印象中的各种大型测绘工程,以及地理国情普查等大型项目的技术服务。

    2016年Esri一年一度的用户大会上,他们就证明了这一点。来自北京市测绘设计研究院城市现状评估团队的关丽博士,在“GIS与行业应用”分论坛的演讲中介绍了他们的新成果。而这也明确传递了一个信息:传统政府测绘部门,正在努力尝试转型。

    关丽和她的团队过去以及现在正在做的,是立足传统测绘数据优势,结合不同类型的新型数据,如互联网数据、手机信令数据、传感器数据、社会调查数据等,摸索和创造全新的空间大数据分析模型,并将分析的成果应用于多场景的城市属性现状评估和未来预测中,为城市体检、城市规划等重要工作提供决策依据。

    以手机信令数据为例,2014年,中国移动每日产生的手机信令条数达7亿条,利用这个数据,可进行初步的居住、就业人口估算,并在此基础上,评估城市的职住平衡、房屋空置率等重要指标。


基于空间大数据的职住系数分析

    但这还只是很小的一部分。系统地说来,关丽和其他团队成员将城市空间大数据的主要来源分为5种,即传统测绘数据(4D产品、地理国情数据、地下管线数据、地名地址数据)、互联网数据(导航数据,如POI、路网、交通流量等,政府、企事业单位发布的数据,社交网络数据)、移动设备数据(手机信令、手环数据)、传感器数据(位移传感器、压力传感器、液面传感器、速度传感器)和社会调查数据(调查问卷、在线调查、电话调查)。这其中有大部分数据可以通过网络、企业合作等各种途径获得,据关丽透露,其团队在网络数据获取上已经取得了系统层面的自动化。


    思路转变:让空间大数据成为传统地信的新武器

    提到传统测绘地理信息部门对空间大数据在应用上经历的变革,关丽认为最重要的一点就在于——思路的转变。这是她不断提到的一个词,以此陈述她在传统地信领域多年最大的感慨。

    在提到空间大数据项目的数据源问题时,关丽这样看待:“我们的立足点不是进行数据生产,也不是进行纯数据收集和整理,最终目标就是怎么样结合其他数据,发挥我手中数据的价值。因为其他数据,无论是互联网数据还是手机信令数据、社会调查数据,如果肯派人扎扎实实收集的话,这些数据不是没有获取渠道的。但是除了这些数据,如果某一个行业获取咱们测绘地理信息数据是比较困难的。”

    在这样的角度上,立足传统地理信息较为详实的数据优势,他们开始进行更多门类的数据收集,如房价数据、环境数据、POI数据等等。关丽表示,初期的信息积累非常不易,而比这更有难度的,还有分析和评估模型的建立,这来自于一个接一个的项目经验积累。关丽向记者举了一个单体建筑的项目示例。

    单体建筑,是城市规划评估中一个重要的指标,也是国家地理国情普查中的一项重要数据成果,在地理国情普查北京市投入的2.8亿人民币中,有8000万左右用于单体建筑的数据收集。关丽所在的团队参与了这项工作,他们将复杂的属性信息录入系统进行分析。不同于过去只录入一幢房屋,他们将每个单体建筑的层高、土地性质(住宅、工业、公共建筑、商用等)、建筑性质(公共、商业),乃至社会属性信息(学校、医院)等信息都做了详尽的积累,为后续许多城市政策决策和规划提供了重要依据。

    例如北京城六区人口疏解的项目,需要非常详实单体建筑数据信息反推人口,且在二环、三环、四环等不同区域都要进行具体分析。又如住建委需要解决的公共设施配套问题,也直接与单体建筑数据相关。多年来,关丽所在团队基于空间大数据的运用和分析服务于上层或大或小的决策,这样的例子还有很多。推广开来,这样的模型还能应用于智慧街道、智慧乡镇等各种场景中。


开放街区项目的建筑属性录入

    记者不禁好奇,诸如此类的传统测绘地理信息部门,到底是如何看待空间大数据的新应用呢?他们的观念又历经了怎样的变化过程?对此,关丽这样回答。

    “历史上整个空间数据更多的是指4D产品,虽然这种数据在各个行业都有很多应用,但是它在行业中的地位往往是工作底图的作用。最多就是在上面叠加一些其他信息进行辅助业务研究。但是,业务上的研究大都是行业自我的内动力,而不是说测绘地理信息人推动它基于我的底图进行行业分析。在历史阶段,其实我们测绘人由于掌握了高精度的数据,很多时候不注重社会属性数据收集,我们觉得我们测绘人不用管那块,觉得没有必要,社会属性数据做规划的去收集就好了,这个我们做测绘的人就是把我们自己的高精度数据测好就可以了。”

    “但是随着时间的发展,也随着我们对各种业务的深入介入,比如规划业务的介入,我们发现规划人做规划编制有它自己的特长,但是这个规划编制应该如何做到更精准?能够指导未来规划?这就是一门学问了,当然规划人已经在这方面做了很深入的探讨,但是在规划业务深入的过程中,我们发现其实它对于现状这一块,由于没有数据获取的途径,对现有情况的掌握并不好,或者说非常不好,这时候就需要整个测绘人补上这个缺口,就是我们所说的城市区域的现状评估。我们单位本身就在规划委下面,我们很清楚地意识到这条路是测绘人应该做的,而且是义不容辞必须扛起来的责任,所以我们把已有的数据再结合我们自己能够获取到的社会属性数据,把原来作为规划现状调查这部分工作承担起来,这种现状评估应该是近期的,周期性的,实时进行更新的。这样的话无论是哪一个行业,要找现状的时候首先就想到测绘地理信息行业。”

    放眼市场,空间大数据的分析和应用已经形成较为成熟的商业模式

    总而言之,不论外界还是地信圈内部,他们对地理信息和空间数据的理解都在逐渐改变。对于传统地信人来说,这样的变化是可喜的。而放眼全球范围的市场,空间大数据分析,尤其是SaaS的空间商业智能业务已经形成了较为成熟的商业模式。

    国际市场上,Mapbox、CartoDB等创业团队正利用SaaS级的GIS更接地气地为更多细分行业领域提供服务。有别于传统GIS应用开发,其易用性和低廉的成本,正在让空间商业智能在消费、金融、保险、物流等领域迅速普及。

    国内方面,SaaS级GIS服务提供商同样注意到空间商业智能领域的巨大应用前景,许多创业公司正在培养这一市场,构建有别于传统GIS的按需付费的商业模式。如之前在8月获得千万级融资的极海纵横,又如超图旗下布局空间智能的创业公司地图慧,抑或是捷泰天域,其曾与Esri中国合作推出中国本土的位置智能平台GeoQ。

    空间商业智能的核心要素是数据,但数据又包含两个要点。一方面,用户通过友好的界面将涉及业务的列表数据导入到地图中,通过基础的空间可视化或借助一些工具,分析业务情况;另一方面,空间商业智能的服务商,通过自主采集或与其他企业或机构(电信运营商、市场调查机构、院校)合作,积累有关社会经济、细分行业、脱敏的人口消费习惯和行为等数据,向客户提供增值服务,进一步辅助提高业务决策的能力。从这个角度看,无论传统测绘院,如关丽所在的团队,还是新型企业或创业公司,他们对空间大数据的应用应该是不断趋于殊途同归的。

    对话关丽:传统测绘院如何看待空间大数据未来?

    泰伯网:未来应该如何更动态地或者是更高效地做空间数据的分析呢?

    关丽:第一,是人才梯队的保障。一方面,我们的团队里要有学测绘地理信息的专业人员,而且是占大头,同时,把其他行业中跟社会属性紧密相关、特别是跟现状评估紧密相关的这些行业人员拉进来,比如说规划、交通、人口都是非常重要的方面。

    第二,是思路上的保障。就是通过我们不断的研讨,确定方向并坚定不移地往这方向走。在方向上,其一,是空间属性+社会属性,社会属性要加大力度,把它做得更深、覆盖面尽量广,但如果广和深取其一的话,选择深。其二,注意对时间序列的保持。比如我们做建筑用地的扩展,我们是从1934年开始做,一直做到2015年。这样一个时间序列往往能够使你发现某一区域和时段的规律,这样的规律性更加明显,而且对未来预测也有一个很好的作用。

    第三,是整个研究模式上的转变。原来我们的数据谁都不能用,现在保密仍然是一个非常重要的问题,但是我们更多的是把它变成一种附加的产品推送给你,如经过二次生产和统计分析之后,或者经过脱敏的加工后,为用户提供产品。在整个数据应用方式上,我们现在也在逐步做这方面的转变。同时,我们现在不是自己做研究,更多的是以开放的心态跟高校、跟研究所一起来做这个研究。大家共同面向社会热点、行业热点把这个数据的作用发挥起来。

    泰伯网:此次参加Esri中国用户大会,能不能谈谈如何利用工具软件更好地进行空间大数据分析?

    关丽:在整个区域评估研究过程中,一开始我们更多是借助成型的工具软件,如ArcGIS给了我们很大的支持,基于这样的软件,我们融入自己的业务知识并做后期的成果展示。前两年的时候,我们更多是借助ArcGIS的空间分析功能和三维展示功能,后期呈现一开始就直接用ArcGIS出图,但有一些展现我们又借助了其他工具软件。包括我们在引进一些人才的时候我们对他针对ArcGIS掌握的程度都是一个重要的指标。

    但是现在,通过二次开发,我们对空间分析这块融入了更多的业务知识,不同的分析模块可能分属不同领域,如人口、房屋、城市安全、交通等。前期这个工作非常艰难,现在一些指标终于可以固化了,可以用软件自动化了。

    泰伯网:如何评价未来国家包括政府决策对空间大数据的应用前景?

    关丽:第一,大家会越来越把咱们已有的传统测绘数据当成一种非专业化数据来看待。这种趋势是一个好事,因为越专业你的面就会越窄,好比大家对三维数据的看法一样,不再觉得三维数据这个东西很高大上、我们用不起。但是数据的采集生产过程还是专业化的,应用端应该变得越来越非专业化。

    第二,外部的应用驱动内部的数据生产。比如,商业需求或者一些委办局需求会直接影响我们测绘地理信息行业内部的生产流程。原来我们可能觉得,我们就做这个(数据),给你能用多少就是多少,但是现在不是这样,这种趋势会越来越明显。

    第三,对于未来测绘地理信息行业的发展趋势,整个学科的交叉会越来越强,我们与行业知识的融合会越来越密切。这样的话,一方面是我们自己的数据附加价值能够被深度地挖掘出来,同时又使我们这个行业能够既有它的专业性也有它的服务广泛性,这点应该比现在做得更好,有更多业务的东西加入进来。

    第四,从未来发展趋势来看,数据的共享和开放肯定是一种大的趋势。但是测绘地理信息数据如果想完全开放这个可能性不太大,所以说我们应该最大程度地获取其他社会属性数据,这会推动我们测绘整个行业向业务深度化发展,或者说会向着委办局服务的深度化发展。(文|泰伯网 思佳) 

http://user.qzone.qq.com/271151211/blog/1505385014

这篇关于一位GIS女博士眼中的空间大数据分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/596831

相关文章

GIS图形库更新2024.8.4-9.9

更多精彩内容请访问 dt.sim3d.cn ,关注公众号【sky的数孪技术】,技术交流、源码下载请添加微信:digital_twin123 Cesium 本期发布了1.121 版本。重大新闻,Cesium被Bentley收购。 ✨ 功能和改进 默认启用 MSAA,采样 4 次。若要关闭 MSAA,则可以设置scene.msaaSamples = 1。但是通过比较,发现并没有多大改善。

Python:豆瓣电影商业数据分析-爬取全数据【附带爬虫豆瓣,数据处理过程,数据分析,可视化,以及完整PPT报告】

**爬取豆瓣电影信息,分析近年电影行业的发展情况** 本文是完整的数据分析展现,代码有完整版,包含豆瓣电影爬取的具体方式【附带爬虫豆瓣,数据处理过程,数据分析,可视化,以及完整PPT报告】   最近MBA在学习《商业数据分析》,大实训作业给了数据要进行数据分析,所以先拿豆瓣电影练练手,网络上爬取豆瓣电影TOP250较多,但对于豆瓣电影全数据的爬取教程很少,所以我自己做一版。 目

【高等代数笔记】线性空间(一到四)

3. 线性空间 令 K n : = { ( a 1 , a 2 , . . . , a n ) ∣ a i ∈ K , i = 1 , 2 , . . . , n } \textbf{K}^{n}:=\{(a_{1},a_{2},...,a_{n})|a_{i}\in\textbf{K},i=1,2,...,n\} Kn:={(a1​,a2​,...,an​)∣ai​∈K,i=1,2,...,n

win7系统中C盘空间缩水的有效处理方法

一、深度剖析和完美解决   1、 休眠文件 hiberfil.sys :   该文件在C盘根目录为隐藏的系统文件,隐藏的这个hiberfil.sys文件大小正好和自己的物理内存是一致的,当你让电脑进入休眠状态时,Windows 7在关闭系统前将所有的内存内容写入Hiberfil.sys文件。   而后,当你重新打开电脑,操作系统使用Hiberfil.sys把所有信息放回内存,电脑

求空间直线与平面的交点

若直线不与平面平行,将存在交点。如下图所示,已知直线L过点m(m1,m2,m3),且方向向量为VL(v1,v2,v3),平面P过点n(n1,n2,n3),且法线方向向量为VP(vp1,vp2,vp3),求得直线与平面的交点O的坐标(x,y,z): 将直线方程写成参数方程形式,即有: x = m1+ v1 * t y = m2+ v2 * t

[Linux]:环境变量与进程地址空间

✨✨ 欢迎大家来到贝蒂大讲堂✨✨ 🎈🎈养成好习惯,先赞后看哦~🎈🎈 所属专栏:Linux学习 贝蒂的主页:Betty’s blog 1. 环境变量 1.1 概念 **环境变量(environment variables)**一般是指在操作系统中用来指定操作系统运行环境的一些参数,具有全局属性,可以被子继承继承下去。 如:我们在编写C/C++代码的时,在链接的时候,我们并不知

【编程底层原理】方法区、永久代和元空间之间的关系

Java虚拟机(JVM)中的内存布局经历了几个版本的变更,其中方法区、永久代和元空间是这些变更中的关键概念。以下是它们之间的关系: 一、方法区: 1、方法区是JVM规范中定义的一个概念,它用于存储类信息、常量、静态变量、即时编译器编译后的代码等数据。 3、它是JVM运行时数据区的一部分,与堆内存一样,是所有线程共享的内存区域。 二、永久代(PermGen): 1、在Java SE 7之前,

算法复杂度 —— 数据结构前言、算法效率、时间复杂度、空间复杂度、常见复杂度对比、复杂度算法题(旋转数组)

目录 一、数据结构前言 1、数据结构 2、算法 3、学习方法 二、 算法效率 引入概念:算法复杂度  三、时间复杂度 1、大O的渐进表示法 2、时间复杂度计算示例  四、空间复杂度 计算示例:空间复杂度 五、常见复杂度对比 六、复杂度算法题(旋转数组) 1、思路1 2、思路2 3、思路3 一、数据结构前言 1、数据结构         数据结构(D

win7下安装Canopy(EPD) 及 Pandas进行python数据分析

先安装好canopy,具体安装版本看自己需要那种,我本来是打算安装win764位的,却发现下载总是出现错误,无奈只能下载了32位的! https://store.enthought.com/downloads/#default 安装好之后,参考如下连接,进行检验: 之后再根据下面提供的连接进行操作,一般是没问题的! http://jingyan.baidu.com/article/5d6

「大数据分析」图形可视化,如何选择大数据可视化图形?

​图形可视化技术,在大数据分析中,是一个非常重要的关键部分。我们前期通过数据获取,数据处理,数据分析,得出结果,这些过程都是比较抽象的。如果是非数据分析专业人员,很难清楚我们这些工作,到底做了些什么事情。即使是专业人员,在不清楚项目,不了解业务规则,不熟悉技术细节的情况下。要搞清楚我们的大数据分析,这一系列过程,也是比较困难的。 我们在数据处理和分析完成后,一般来说,都需要形成结论报告。怎样让大