Sora走红,浅谈GIS在AI方面的应用

2024-02-20 19:12

本文主要是介绍Sora走红,浅谈GIS在AI方面的应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 龙年第一个爆火的,竟然是AI?

2024年2月16日,就在我们忙着过春节时,大洋彼岸,OpenAI又悄无声息地放出了“王炸”:颠覆人类对AI视频认知的文生视频大模型——Sora。

虽然未经提前预热,但Sora很快成为科技圈的重磅热点,引发360创始人周鸿祎等人下场讨论。

周鸿祎认为:Sora的诞生意味着AGI(通用人工智能)实现可能从10年缩短至一两年!

各社交媒体上,引发了大量关于sora的讨论:

短短数日,在抖音上,关于sora的讨论量也达到1.7亿:

 

图片

2. Sora是什么?能做什么?

Sora,是指OpenAl在2024年2月16日发布的首个文本生成视频模型。Sora可以根据用户的提示,生成长达一分钟的视频,同时保持较高的视觉质量。

从2022年11月Chat GPT的横空出世,到2024年初Sora的爆火,再到国产AI软件层出不穷,AI技术正在以惊人的速度发展。

暂时抛开“版权”“隐私”和“伦理”问题,很明显,无论是否准备好,我们正在迅速迈向一个由AI驱动的世界。

AI的应用领域十分广泛,我们回归到熟悉的领域:地理信息系统。

那么,AI和GIS能擦出什么样的火花?AI能带动GIS发展吗?还是说GIS能助力AI,成为AI发展的王牌助手?

在讨论这个问题之前,我们先简单了解一下AI是什么?

 

3. 什么是AI?

人工智能(Artificial Intelligence,简称AI)是一门研究如何使计算机系统具备智能行为的学科。其目标是使机器能够执行需要智能的任务,模拟甚至超越人类的某些智能能力。人工智能涉及多个领域,包括机器学习、深度学习、自然语言处理、计算机视觉、专家系统等。

图片

AI的发展历程

图片

AI的市场规模

4. 什么是计算机视觉?

由于AI应用范围比较广泛,这里重点介绍计算机视觉方面,跟GIS联系较为紧密。

计算机视觉是AI领域的一个重要分支,致力于使计算机系统具备对图像和视频进行理解和解释的能力。

它涉及使用计算机算法和模型,使计算机能够模拟人类视觉系统的功能,从而实现对图像和视频的感知、分析和理解。

常见的计算机视觉任务,主要主要有四类:

图像分类:图像分类是将图像分为不同类别的任务,通过训练模型使计算机能够自动识别图像中的对象。

物体识别:物体识别涉及识别图像中的整个物体,并理解其在场景中的位置和角度。

目标检测目标检测是识别图像中特定物体或目标的过程,可以用于自动驾驶、安防监控等应用。

三维重建三维重建涉及从二维图像中还原出三维场景的空间结构,常用于计算机辅助设计和虚拟现实。

5. AI在GIS软件方面的应用

以mapgis为例,下面是AI在GIS方面应用的一个整体框架:

这个框架呢主要就是分了四层,第一底层是数据层,主要就是我们MapGIS SDE和MapGIS的data store;第二层是一个框架层,主要就是这些个人工智能的框架,能够对这些算法进行支持;主要我们使用的最多的应该是TensorFlow和PyTorch。

第三个就是针对不同任务,进行一个细致划分的一个功能层。主要包括模型库、流程工具和功能库,这个模型库里边,主要就是我们已经封装好的一些算法,比如说什么常见的一些CNN RNN,还有这个对抗生成网络GAN,还有这个长短长短期记忆网络,或者是YOLO。

这些网络流程工具主要用来处理视觉上面的一些数据。因为我们视觉方面的数据大部分都是一些遥感图像,所以就需要涉及到数据准备一些工作。

这些AI工具最擅长的是应用层主要就是什么地理实体提取和变化检测之类的一些数据处理方面,就是通过data store进行一个管理,主要管理的就是影像和矢量图层。

图片

人工智能数据处理框架图

6. 这些工具主要有哪些功能呢?

标准数据增强:

主要包括线性拉伸、随机旋转、数据归一化等手段进行标准的数据增理

图片

图像裁剪增强:

RandErasing方法,随机生成掩膜来增加模型对复杂地物的适应性

图片

图像混叠类增强:

可增强模型的抗干扰能力

图片

7. 常见的AI算法

说到底层技术,不得不谈到算法,AI的核心还是模型和算法。GIS方面应用较多的AI算法有以下几类,这里仅距离说明。

1、影像分类:

影像分类是指对影像的类别进行定性地分析,在多幅相似或不同的遥感影像中可以精确地分辨出遥感影像的类别(或影像所描述的场景),针对大范围影像分类结果返回一个大小均匀的矢量网格,每个网格带有其对应位置影像的类别标签:针对单张图片,影像分类结果返回的是图片的类别信息,总体来说影像分类是一种高于像元级别的粗粒度分类方法。

该方法不仅仅适用基于小范围遥感影像的语义分析对遥感影像数据进行分析和管理,还可以基于对图像的场景理解,对图像的类别做出评估。

自动化图像分类: 

图像分类网络通过学习大量标记好的图像数据,能够自动识别和分类图像中的内容。这使得大规模图像的分类工作可以高效自动完成,减轻了人工劳动负担。

提高图像识别准确性:

图像分类网络通过深度学习算法,能够学习图像中的复杂特征和模式,从而提高了图像识别的准确性。这对于各种应用场景,如医学影像、安防监控、自动驾驶等,具有重要意义。

推动深度学习发展:

图像分类网络是深度学习领域的代表性应用之一。其成功应用推动了深度学习技术的发展,为其他复杂任务的解决提供了经验和基础

2、语义分割

是计算机视觉领域中一种重要的图像分析任务,其目标是将图像中的每个像素分配到预定义的类别中,从而实现对图像的精细化理解。与目标检测不同,语义分割不仅关注物体的位置,还关注物体的边界和形状,使得每个像素都被赋予语义标签。

图片

U-Net(全卷积网络)是一种用于图像分割任务的深度学习架构,由德国图灵奖获得者Ronneberger等人于2015年提出。U-Net的设计灵感来源于生物医学图像分割的需求,尤其是医学图像中器官和病变的精确分割。

图片

U-net网络结构示意图

DeepLab是一系列用于语义分割任务的深度学习模型,由Google提出。这一系列模型以卷积神经网络为基础,通过引入深度可分离卷积和空洞卷积等技术,致力于解决图像分割中的细节捕捉和计算效率的问题。

图片

DeepLab v2模型示意图

其他的这里就不一一赘述。

需要更多详细介绍的同学,可以戳下面备注【人工智能与GIS】,领取详细视频讲解:

免费领取GIS开发相关学习资料

8. AI在GIS中的应用

图片

模型说明:

  • 适用功能:影像分析,二元分类和多元分类。

  • 适用场景建筑物、道路等地物提取。

输入数据类型

  • 影像数据

算法特点:

  • 速度快、精度高、网络结构清晰

图片

结果说明:

通过对测试数据进行预测后,计算出了精度(Accuracy)、召回率(Recall)和F1指标(F1 score)我们可以看出,加入了注意力机制,模型的精度极大提升。

9. AI未来的发展方向之:语言大模型(LLM)

图片

最后,谈一下红极一时的chatgpt对人工智能发展的一些贡献和特点。

Chatgpt主要贡献:

  • 强化学习中引入人类反馈的学习方法

  • 高质量微调数据指令集的重要性

核心能力:生成、总结、提取、分类、检索和改写

图片

10. ChatGPT的主要技术:

Transformer架构: ChatGPT基于Transformer架构。Transformer是一种使用自注意力机制(Self-Attention Mechanism)的深度学习模型,适用于处理序列数据,如自然语言。自监督预训练: ChatGPT采用了自监督预训练的方法。这意味着在模型在特定任务上进行微调之前,它首先在大规模的语料库上进行了预训练。GPT模型通过学习预测序列中缺失的一部分内容,从而学到了语言的结构和上下文理解。

大规模参数: GPT-3是一个参数规模庞大的模型,具有1750亿个参数,这使得家在各种任务上表现出色,包括聊天式对话。

微调: ChatGPT可能会在特定的任务上进行微调,以适应更具体的应用。微调过程通常涉及在特定任务的有标签数据上对模型进行额外的训练。

上下文处理: GPT模型使用自注意力机制,能够有效地处理长文本序列,这对于处理上下文丰富的对话非常有用。

12. GIS+GIS=GeoGPT:

将语言大模型和GIS工具集结合在一起,降低非专业用户解决地理空间任务的门槛。主要应用在:间数据抓取、空间查询、设施选址和制图等方面。

图片

简单概括一下上述GIS tool pool的流程:

首先用户提需求,通过AI模型的反复分析,分解为各个指令,再从GIS的相关应用词里面抽取一部分符合任务描述要求的工具,组成一个流程图,最后输出的一个结果。

再看下面这个图:

图片

这个图就是一个学校的选址的流程。

要求1:我想要离公园近一点;

要求2:我还想要离工厂远一点;

这里就涉及到GIS中的缓冲区的概念。

右边的图中可以看到公园和那个公交站的一个交叉区域,通过离工厂的一个半径,最后筛选出来,适合选址的一个区域。

这样做的主要优势在于,能够就是降低非专业用户的门槛——非GIS专业的认,也能够通关AI模型,解决地理空间任务和问题。

关于GIS和AI的内容,我们暂时介绍到这里。

想查看完整版视频讲解,请戳下方按钮备注【人工智能与GIS】即可获取。

免费领取GIS开发相关学习资料icon-default.png?t=N7T8https://www.wjx.cn/vm/eqvTtp6.aspx# 

 

Sora大模型为数字经济创新发展打开了一扇大门,形成了引领人工智能产业发展的一个新的通道,这不仅带来很大启发,更大地带来了产业的冲击。”杭州新春第一会上市委书记刘捷这样说到:“杭州数字经济高速发展,在这一轮人工智能发展新机遇上,唯有加快改革、加快发展,适应和抢抓新机遇。”

在新型城镇化建设深入推进、“数字中国”战略持续实施、“双碳”目标加快落实、数字技术与实体经济深度融合、数字化转型全面提速的背景下,智慧城市建设迎来新机遇。

数字化经济不断发展,数字化人才的需求也逐渐浮出水面!

成为数字化人才的第一步,学习一项专业技能!

在新中地GIS开发特训营,各位学员通过渐进式的GIS开发技能提升、多层次的职场能力培养、全方位就业服务体系。他们不仅具备了GIS开发能力和丰富的项目经验,也具备了职场必需的表达沟通和总结汇报能力,在职业发展中极具竞争力!

7天免费试听GIS开发课程

☑0基础可学   ☑助力考研   ☑优选赛道

扫码填表即可免费获取7天课程

附送送海量GIS资料

2024GIS开发特训营免费体验券

这篇关于Sora走红,浅谈GIS在AI方面的应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/729255

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

zoj3820(树的直径的应用)

题意:在一颗树上找两个点,使得所有点到选择与其更近的一个点的距离的最大值最小。 思路:如果是选择一个点的话,那么点就是直径的中点。现在考虑两个点的情况,先求树的直径,再把直径最中间的边去掉,再求剩下的两个子树中直径的中点。 代码如下: #include <stdio.h>#include <string.h>#include <algorithm>#include <map>#