清华把大模型用于城市规划,回龙观和大红门地区成研究对象

本文主要是介绍清华把大模型用于城市规划,回龙观和大红门地区成研究对象,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

引言:参与式城市规划的新篇章

随着城市化的不断推进,传统的城市规划方法面临着越来越多的挑战。这些方法往往需要大量的时间和人力,且严重依赖于经验丰富的城市规划师。为了应对这些挑战,参与式城市规划应运而生,它强调不同利益相关者,包括官员、专业人士、开发商、当地居民和公众的积极参与。这种包容性的方法旨在通过精心设计的程序、讨论、小组会议或研讨会,将多样化的视角纳入规划和决策过程中。然而,参与式规划的传统范式仍然存在许多实践中的挑战,如成本高昂、缺乏熟练的协调者、效率低下以及参与兴趣低落。

幸运的是,随着信息技术的飞速发展,尤其是大语言模型(LLMs)的出现,我们有了新的解决方案。在本研究中,我们引入了一个基于LLM的多代理协作框架,模拟规划师和数千名具有不同特征和背景的居民,用于参与式城市规划,可以生成考虑居民多样化需求的城市区域土地利用规划。此外,为了提高讨论的效率,我们采用了鱼缸讨论机制,其中部分居民讨论,其余的居民在每一轮中充当听众。最后,我们让规划师根据居民的反馈修改规划。

我们在北京的两个区域部署了我们的方法。实验表明,我们的方法在居民满意度和包容性指标上达到了最先进的性能,并且在服务可达性和生态指标方面也超过了人类专家。

论文标题: Large Language Model for Participatory Urban Planning

论文链接: https://arxiv.org/pdf/2402.17161.pdf

大语言模型(LLM)在城市规划中的创新应用

1. 传统城市规划的局限性

传统的城市规划方法依赖于经验丰富的规划专家,涉及多方利益的考量,并且通常需要对独特的社区问题进行个案审查。这种方法要求大量的时间和人力资源,并且严重依赖于经验丰富的城市规划师。随着城市的持续增长和城市更新需求的稳步上升,传统城市规划方法的局限性变得越来越明显,迫切需要探索能够提高其效率和有效性的创新方法。

2. LLM作为模拟人类代理的潜力

近年来,大语言模型(LLM)展现出了模拟人类代理的显著能力,这为轻松模拟参与式过程提供了可能。在城市规划领域,LLM可以用来生成考虑居民多样化需求的土地利用规划。

如下图所示,可以构建LLM代理来模拟规划师和成千上万具有不同特征和背景的居民。首先,让规划师进行初始土地利用规划。为了处理居民不同的设施需求,可以在每个社区中启动居民之间的讨论,居民根据他们的特征提供反馈。此外,为了提高讨论的效率,采用鱼缸讨论机制,部分居民参与讨论,其他人在每轮中充当听众。最后,规划师根据居民的反馈修改规划。

在北京的两个区域进行的实验表明,该方法在居民满意度和包容性指标上实现了最先进的性能,并且在服务可达性和生态指标方面也超过了人类专家。

多代理协作框架的构建

1. 角色设计:规划师与居民代理

如下图,在构建多代理协作框架时,首先需要设计不同的角色来模拟城市规划中的真实参与者。规划师代理负责整体规划考量,需要理解区域的空间分布,并根据人类专家设计的规划指南提出初始规划。居民代理则是参与式城市规划中不可或缺的一部分,因此设计LLM代理来模拟该区域的居民。每个居民代理都有详细的个人资料,包括性别、年龄、教育水平和家庭规模。为了确保公平和包容性,一些居民代理被赋予了特殊背景,如有孩子的家庭、有病人的家庭和独居老人。每个居民代理都被随机分配一个家庭地址,并且只能观察到他们家附近15分钟步行或骑行范围内的区域。

2. 规划工作流程:初始规划与居民反馈

在规划师和居民代理的角色确定后,提出了一个通过多代理协作的规划流程。规划师首先基于要求和专家知识提出初始规划,然后关键的参与式规划理念是征询居民对该规划的意见并据此进行修订。然而,不同居民可能对土地利用有不同的需求,这可能导致邻近居民之间的利益冲突。为了更好地平衡他们的需求,提出让居民通过讨论来相互沟通。由于居民只关心他们家附近的区域,因此讨论不必包括所有居民,而只需要在邻近居民之间进行。因此,将整个区域划分为基于现实世界社区和道路网络的四个不同社区。对于每个社区,邀请居住在那里或附近的居民进行几轮讨论,在讨论中分享对土地利用规划的意见。根据居民在讨论中的意见,规划师相应地修订该社区的规划。

为了应对大量居民参与讨论的挑战,提出采用鱼缸讨论机制来提高讨论的效率。在每轮中,居民被分为内圈和外圈。内圈的居民积极参与讨论,而外圈的居民则认真倾听。每轮讨论后,内外圈的成员会随机交换,并且讨论历史被总结以避免过长的上下文。通过这样的设计,规划师和居民代理能够高效有效地协作生成考虑不同居民需求的土地利用规划。

鱼缸讨论机制:提升效率的关键

在参与式城市规划中,传统的参与范式往往需要经验丰富的规划专家,且常常耗时且成本高昂。为了提高讨论效率,我们采用了鱼缸讨论机制。在这种机制中,部分居民参与讨论,其余的居民则作为听众。每轮讨论结束后,内外圈的成员会随机交换,讨论历史也会被总结,以避免过长的对话文本。通过这种设计,规划师和居民代理能够高效、有效地共同制定出考虑到不同居民需求的土地利用规划。

实验设置与基准比较

1. 实验数据集介绍:北京的两个区域案例

我们的方法部署在北京的两个真实世界区域(下图):回龙观(HLG)和大红门(DHM)。HLG位于北京市中心以北33公里处,原本是一个卫星城镇,现已融入北京大都市区。由于居民需远距离通勤,HLG成为了一个典型的通勤城镇。DHM位于北京南部,有着悠久的居住历史,城市布局杂乱无章,混合了住宅、商业、仓储、物流和租赁复合体。两个区域的选择考虑到了它们在社会经济概况、人口组成和城市规划复杂性上的多样性。

2. 实施细节与评价指标

我们根据道路和现有土地利用条件将HLG和DHM区域划分为若干区域。我们保留了居住区和主要绿地,将其他区域视为待规划的空地。HLG和DHM各有42个空地区域需要规划(下表)。为了确保规划结果现实可行,我们为两个社区设定了基础设施覆盖的最低要求。

在实验中,我们使用了gpt-3.5-turbo-1106作为居民代理,使用gpt-4-vision-preview作为规划师代理,因为它需要输入区域地图。在每个社区的规划过程中,我们让居民进行了3轮讨论,每轮选出50名居民参与讨论。为了确保结果的稳健性,我们将LLM的温度设置为0,并报告了使用不同随机种子的五次运行的平均结果。

为了评估我们的框架,我们选择了六种方法作为比较基准:随机方法(Random)、集中方法(Centralized)、分散方法(Decentralized)、几何集合覆盖算法(GSCA)、深度强化学习(DRL)以及人类设计师(Human Expert)的结果。

而评价指标,我们采用了两类:不考虑需求的(need-agnostic)和考虑需求的(need-aware)。不考虑需求的指标是聚合指标,提供了整个社区的概览,专注于服务(Service)和生态(Ecology),而不考虑个体的定制化需求。考虑需求的指标包括满意度(Satisfaction)和包容性(Inclusion),这些指标衡量了规划过程是否充分考虑了边缘群体的需求,从而促进了更公平和包容的城市发展策略。我们将不考虑需求的和考虑需求的服务和生态满意度以及包容性结合起来,以衡量意向草案的性能,旨在符合参与式规划的核心愿景,并照顾到所有利益相关者的满意度。

实验结果:LLM在居民满意度和包容性上的表现

实验的具体比较数据见下表,粗体字是最佳结果,下划线是次佳结果。

1. 居民满意度

在实验中,我们的LLM方法在居民满意度(Satisfaction)上表现出色,超过了所有基线方法。例如,在HLG数据集上,我们的方法的满意度得分为0.787,这意味着居民平均能够在500米内访问到78.7%的他们需要的设施,比基线方法至少提高了11.2%。这一结果表明,我们的方法能够通过允许居民讨论并根据他们的意见修改计划,有效地考虑居民的多样化需求。

2. 包容性

在包容性(Inclusion)方面,我们的方法同样取得了最佳表现。在HLG数据集上,包容性得分为0.773,表明77.3%的边缘化群体的需求得到了满足。这一成绩进一步证明了我们的方法能够确保更加公平和包容的城市发展策略。

角色扮演与讨论设计的有效性分析

1. 角色扮演的有效性

为了评估角色扮演设计的有效性,我们进行了消融实验(下图),其中移除了所有居民的个人资料,并将他们替换为相同的提示:“你是城市中一个地区的居民”。结果显示,去除角色扮演后,居民满意度和包容性指标分别下降了4.7%-8.0%,这表明居民的个人资料能够有效反映他们的多样化需求。

2. 讨论设计的有效性

在讨论设计方面,我们同样进行了消融实验(上图),其中不允许居民之间进行讨论。相反,参与讨论的居民只是单独报告他们对计划的看法,然后这些意见被汇总并发送给规划师进行计划修订。结果显示,去除讨论后,居民满意度和包容性指标分别下降了4.1%-6.3%,这表明单独询问并汇总每个居民的意见是次优的。相比之下,讨论允许居民相互交流,更好地平衡了他们的不同意见和多样化需求。

3. 讨论过程分析

通过对HLG地区的案例分析,我们观察到在社区讨论和规划师修订过程中,居民的意见得到了充分的交流和考虑,从而提高了整个社区的满意度。例如,见下图(a),在社区1的讨论中,大多数居民对计划已经表示满意,但仍有一些有特殊需求的居民提出在区域1、3和5增加新设施的建议。经过几轮讨论,许多其他居民接受了这些意见并表示支持,因此规划师根据这些建议对这些区域进行了修订。下图(b)是各社区修订后的指标。0表示初始规划,4表示四个社区修改后的最终规划。指标为5次运行的平均值。

综上所述,我们的LLM方法不仅能够有效地考虑居民的多样化需求,而且在提供公共服务可达性和生态评分方面与最先进的强化学习方法相媲美。通过多代理协作设计,我们的方法在居民满意度和包容性方面取得了显著的成绩,同时也保持了与人类专家相当的服务和生态指标。

讨论过程分析:居民意见的交流与规划师的修正

在参与式城市规划中,居民的积极参与是规划过程的核心。为了平衡居民的多样化需求,本研究采用了基于LLM的多代理合作框架。在这个框架中,规划师首先提出一个初始的土地利用计划,然后通过居民之间的讨论来修正这个计划。这一过程的关键在于如何让居民之间的交流更有效,并确保规划师能够根据居民的反馈进行合理的修改。

1. 居民意见的交流

在每个社区内,居民基于他们的个人档案(包括性别、年龄、教育水平和家庭大小等信息)提出对初始规划的反馈。例如,有孩子的家庭可能需要学校,而有病人的家庭可能更倾向于医疗服务和公园。通过让居民在讨论中表达他们的意见,可以更好地平衡他们的需求。在讨论过程中,居民们不仅分享了他们对土地利用计划的看法,还有机会了解到其他居民的需求和建议。

2. 规划师的修正

规划师在居民讨论后对计划进行修正。这一过程中,规划师需要综合考虑居民的反馈,并做出相应的调整。例如,在讨论过程中,如果多数居民对某个区域的规划表示满意,但有特殊需求的居民提出了增加新设施的建议,规划师可能会根据这些建议对该区域进行修改。通过这种方式,即使是少数群体的观点也能得到充分的讨论和考虑,从而提高整个社区的满意度。

超参数研究:讨论轮数对结果的影响

在本研究中,讨论轮数是一个重要的超参数,它直接影响到居民讨论的深入程度和规划修正的效果。为了探究讨论轮数对结果的影响,我们进行了一系列实验,讨论轮数从1到4不等。

1. 讨论轮数的设定

实验中,居民讨论的轮数设定为1到4轮。在每一轮讨论中,居民们分享他们对土地利用计划的看法,并对计划提出建议。规划师则根据这些讨论的结果进行计划的修正。

2. 讨论轮数对结果的影响

实验结果显示(下图),当讨论轮数从1增加到3时,居民满意度(Satisfaction)和包容性(Inclusion)指标有显著提升。例如,在HLG数据集上,居民满意度从0.738提升到0.787,包容性指标提升了5.9%。这表明多轮讨论能够更好地平衡居民的不同意见,并制定出更能满足他们需求的土地利用计划。

然而,当讨论轮数增加到4时,这些指标没有进一步提升(上图),这可能是因为过长的讨论可能导致性能的停滞甚至恶化。此外,服务(Service)指标的趋势与居民满意度和包容性指标相似,而生态(Ecology)指标则有所波动,这可能是由于在设施和绿地之间存在潜在的权衡。

综上所述,讨论轮数对居民讨论和规划修正的结果有直接影响。适当的讨论轮数可以促进居民之间的有效沟通,帮助规划师根据居民的反馈做出更合理的规划调整。

结论与未来展望:LLM在城市规划中的潜力与挑战

1. 结论

本研究通过引入大语言模型(LLM)来模拟参与式城市规划的全过程,展示了LLM在城市规划中的应用潜力。我们设计了LLM代理来模拟规划师和具有不同背景的居民,通过特定的提示设计来实现这一点。然后,我们提出了一个框架,居民可以讨论规划师制定的土地利用计划,并且规划师根据讨论结果相应地修订计划。此外,为了在大量居民中进行更有效的讨论,我们采用了鱼缸讨论机制,其中部分居民进行讨论,其余的居民则倾听。在北京的两个真实世界场景中部署了我们的方法,结果表明我们的方法能够有效满足居民的多样化需求,并且在服务可达性和生态指标方面与最先进的强化学习方法相媲美。

2. 未来展望

尽管LLM在城市规划中展现出了巨大的潜力,但我们必须承认,在整个过程中对规划要素的简化可能会导致与实际规划场景的偏差。例如,所有权、开发成本和更高层次的规划等因素在本研究中被省略,这可能会影响到规划的实际应用。希望这些不足可以通过新的提示设计来解决,而不会影响我们框架的有效性和可解释性。此外,我们的框架在很大程度上依赖于手动设计的提示,尤其是对于规划师而言。为了使规划师代理理解规划地图,我们需要描述每个区域的位置和邻近情况,这限制了我们方法的泛化能力。

未来的工作方向之一是将我们的框架与人类专家结合起来,构建人工智能协作工作流。例如,我们可以用人类替换规划师或某些居民,以获得更好的真实性和性能。此外,多代理协作设计也有望应用于涉及大量代理的其他任务。

3. 挑战

LLM在城市规划中的应用面临着多方面的挑战。首先是数据的准确性和代表性问题,LLM的输出质量高度依赖于输入数据的质量。其次,LLM在处理复杂城市规划问题时可能需要更高级的理解和推理能力。此外,参与式规划的核心是包容性和多样性,LLM需要能够处理来自不同背景和利益的居民的反馈。最后,随着技术的发展,如何确保LLM的透明度和可解释性,以及如何处理与现有规划流程的集成问题,都是需要进一步探索的重要问题。

这篇关于清华把大模型用于城市规划,回龙观和大红门地区成研究对象的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/807696

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号