企业应将三成AI预算用于管理安全风险

2023-11-01 22:52

本文主要是介绍企业应将三成AI预算用于管理安全风险,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本周二,科大讯飞因AI内容安全事件导致股价暴跌,同时也给野蛮生长的生成式人工智能行业敲响了警钟。

今天,基于大语言模型的生成式人工智能的安全风险已经从担忧变成现实,黑客只需要通过一些“有毒内容”,或者发布几个恶意网页和图片,就能控制甚至扰乱最先进的大型语言模型应用。与此同时,由于生成式AI与生俱来的“黑匣子”特性,伴随“AI军备竞赛”快速成长的自主AI系统越来越难以监管,随时有可能失控并带来灾难性后果。

人工智能安全预算占比不应低于三分之一

近日,两位人工智能教父级人物Yoshua Bengio和Geoffrey Hinton联合其他22位知名人工智能学者和专家(其中包括三位清华大学学者)提出了一个AI政策和治理框架议案,旨在解决人工智能日益增长的风险。

“AI产生的错误信息和算法歧视等危害如今已经很明显,其他危害也有出现的迹象,解决持续危害和预测新出现的风险至关重要。”提案强调:“如果没有足够的谨慎,我们可能会不可逆转地失去对自主人工智能系统的控制,从而导致人类干预失效。大规模网络犯罪、社会操纵和其他突出危害可能会迅速升级。这种不受控制的人工智能进步可能最终导致大规模生命和生物圈的丧失,乃至人类的边缘化甚至灭绝。”

该提案明确指出:

企业和政府应将至少三分之一的人工智能研发预算用于人工智能安全,并强调了人工智能安全工作的紧迫性。

该提案引起了全球人工智能产业和监管部门的格外重视,因为人工智能安全峰会下周即将在英国布莱切利公园将举行,届时国际政界人士、技术领袖、学者和产业人士将齐聚一堂,讨论如何监管人工智能风险。

人工智能的五项紧急安全治理措施

提案呼吁,开发人工智能的大型私营企业以及政府政策制定者和监管机构采取以下五个特别行动:

  • 公司和政府应将至少三分之一的人工智能研发预算用于确保安全和合乎道德的使用,这与他们对人工智能能力的投入相当。

  • 政府迫切需要全面了解人工智能的发展。监管机构应要求模型注册、举报人保护、事件报告以及模型开发和超级计算机使用的监控。

  • 在部署之前,监管机构应有权访问先进的人工智能系统,以评估其危险功能,例如自主复制、闯入计算机系统或使大流行病病原体广泛传播。

  • 监管机构应根据模型功能制定国家和国际安全标准,政府还应该让“前沿人工智能”的开发商和所有者对其模型造成的可合理预见和预防的损害承担法律责任。

  • 对于有危险能力的AI系统,政府必须准备好许可某些人工智能开发,必要时暂停开发以应对令人担忧的能力,强制执行访问控制,并要求对国家级黑客采取强有力的信息安全措施,直到准备好足够的保护措施。

Bengio和Hinton都是人工智能领域的知名专家,面对不断增长的风险,他们加大了对人工智能安全的呼吁力度。(但这些呼吁遭到了另一位著名人工智能领袖Yann Lecun的反对,他认为当前的人工智能风险不需要如此紧急的措施。)

人工智能安全面临五大关键技术挑战

过去几年,随着科技公司专注于开发人工智能技术,“安全第一”的呼声已经被淹没,但随着新的强大功能的出现,业界的态度正趋于谨慎。该提案的其他合著者包括学术和畅销书作家尤瓦尔·诺亚·哈拉里(Yuval Noah Harari)、诺贝尔经济学奖获得者丹尼尔·卡尼曼(Daniel Kahneman)和著名人工智能研究员杰夫·克鲁恩(Jeff Clune)。上周,另一位人工智能领袖穆斯塔法·苏莱曼(Mustafa Suleyman)与其专家提议设立一个类似国际气候变化专门委员会(IPCC)的人工智能安全组织,以帮助制定相关协议和规范。

AI政策和治理框架提案重点关注了那些正在开发自主人工智能或“可以在世界上规划、行动和追求目标的系统”的公司所带来的风险。虽然当前的人工智能系统的自主权有限,但改变这一现状的工作正在进行中。”该论文称。

提案指出,Open AI提供的尖端GPT-4模型可用于浏览网页、设计和执行化学实验以及利用软件工具(包括其他AI模型)。像AutoGPT这样的软件程序已经被创建来自动化此类人工智能流程,并允许人工智能在没有人工干预的情况下继续完成任务。

提案称,这些AI自主系统存在失控的巨大风险,而且没有办法对其进行控制。

“如果我们开发高度先进的自主人工智能,我们就有可能开发出追求不良目标的系统。恶意行为者可能会故意嵌入有害目标。”

提案指出,目前没有人知道如何可靠地将人工智能行为与复杂的人类价值观结合起来。即使是善意的开发人员也可能会无意中开发出追求意想不到目标的人工智能系统——特别是当他们为了赢得人工智能竞赛而忽视了昂贵的安全测试和人类监督。

提案还呼吁业界推进研究突破,以解决人工智能安全和道德面临的五大关键技术挑战:

  • 监督和诚实:能力更强的人工智能系统更善于利用监督和测试中的弱点——例如,产生虚假但令人信服的输出来欺骗测试;

  • 鲁棒性:人工智能系统在新情况下(在分布转移或对抗性输入下)表现不可预测;

  • 可解释性:人工智能决策是不透明的。到目前为止,我们只能通过反复试验来测试大型模型,我们需要学会理解它们的内部运作;

  • 风险评估:先进人工智能系统会开发出不可预见的功能,这些功能只有在训练期间甚至部署后才发现。需要更好的评估以更早地发现危险能力;

  • 应对新风险:未来能力更强的人工智能系统可能会表现出迄今为止仅在理论模型中出现的故障模式。例如,人工智能系统可能会学习假装服从或利用安全控制机制的弱点来实现特定目标。

这篇关于企业应将三成AI预算用于管理安全风险的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/326332

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

客户案例:安全海外中继助力知名家电企业化解海外通邮困境

1、客户背景 广东格兰仕集团有限公司(以下简称“格兰仕”),成立于1978年,是中国家电行业的领军企业之一。作为全球最大的微波炉生产基地,格兰仕拥有多项国际领先的家电制造技术,连续多年位列中国家电出口前列。格兰仕不仅注重业务的全球拓展,更重视业务流程的高效与顺畅,以确保在国际舞台上的竞争力。 2、需求痛点 随着格兰仕全球化战略的深入实施,其海外业务快速增长,电子邮件成为了关键的沟通工具。

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/