OpenAI开始训练新的前沿模型——但GPT-5至少在90天内不会推出

2024-05-30 05:04

本文主要是介绍OpenAI开始训练新的前沿模型——但GPT-5至少在90天内不会推出,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1

ChatGPT 制造商 OpenAI 今早宣布,已开始训练其新的“前沿模型”,并成立了一个新的安全委员会,由现任董事会成员 Bret Taylor(OpenAI 董事会主席兼客户服务初创公司 Sierra AI 联合创始人、前谷歌地图负责人和前 Facebook 首席技术官)、Adam D’Angelo(Quora和 AI 模型聚合应用程序 Poe 的首席执行官)、Nicole Seligman(索尼公司前执行副总裁兼全球总法律顾问)和 Sam Altman(现任 OpenAI 首席执行官兼联合创始人之一)领导。

正如 OpenAI 在公司博客文章中所写:

OpenAI 最近开始训练其下一个前沿模型,我们预计最终的系统将使我们在 AGI 的道路上更上一层楼。虽然我们很自豪能够构建和发布在能力和安全性方面均处于行业领先地位的模型,但我们欢迎在这个重要时刻进行激烈的辩论。

90 天计时器现在开始

值得注意的是,该公司概述了新委员会在指导新前沿 AI 模型开发中将发挥的作用,并指出:

安全与保障委员会的首要任务是评估并进一步制定未来 90 天内 OpenAI 的 流程和保障措施 。90 天结束后,安全与保障委员会将与全体董事会分享他们的建议。在全体董事会审查后,OpenAI 将以符合安全与保障的方式公开分享已采纳建议的最新消息。

因此,可以合理地得出结论:无论新的前沿模型是什么(无论称为 GPT-5 还是其他名称),它至少在90 天内都不会发布,以便为新的安全委员会提供必要的时间来“评估和进一步开发 OpenAI 的流程和保障措施”,并向“全体董事会”发布建议。

这意味着 OpenAI 董事会应不迟于 2024 年 8 月 26 日收到新的安全委员会的建议。

为什么是 90 天,而不是更长、更短或其他时间?OpenAI 并没有具体说明,但该指标是商业中评估和提供流程反馈的常用指标,似乎与其他指标一样好——不太短,也不太长。

新的安全委员会并不独立

此消息立即招致批评,一些人指出,新委员会完全由 OpenAI“自己的高管”组成,这意味着对该公司安全措施的评估将不是独立的。

OpenAI 刚刚成立了一个由其高管和 Altman 本人组成的监督委员会。这是技术自我监管的一种久经考验的方法,但实际上对监督几乎没有任何作用。

​ — Parmy Olson (@parmy) 2024 年 5 月 28 日

OpenAI 董事会此前就曾引发争议,其中许多成员目前都在新成立的安全与保障委员会任职。

2023 年 11 月 17 日,即ChatGPT 一周年纪念日的前五天,OpenAI 非营利控股公司的旧董事会解雇了阿尔特曼的首席执行官职务并解除了公司所有职务,理由是他“并非始终坦诚相待”,结果遭到了员工的坚决反抗和包括大支持者微软在内的 OpenAI 投资者的强烈反对。

2024 年 11 月 21 日,奥尔特曼最终恢复了 OpenAI 首席执行官一职,董事会成员也由泰勒、拉里·萨默斯和亚当·德安杰洛接任,微软也以无投票权观察员的身份加入。当时,董事会因完全由男性主导而受到批评。

今年3 月 8 日,其他成员 Sue Desmond-Hellmann(比尔和梅琳达·盖茨基金会前首席执行官)、Fidji Simo(Instacart 首席执行官兼董事长)、Seligman 和 Altman 也被任命为新董事会成员。

OpenAI(以及人工智能行业)的艰难时期

OpenAI 本月早些时候发布了其最新的 AI 模型GPT-4o,自那时起,其公关形势就一直不太好。

尽管新模型是 OpenAI 同类模型中的第一个(也可能是世界上第一个),从一开始就对多模态输入和输出进行训练,而不是像之前的 GPT-4 那样将几个经过文本和媒体训练的模型串联起来,但该公司还是受到了演员斯嘉丽·约翰逊的批评,她指责 OpenAI 与她接洽,希望她为其新助手配音,并展示了一个她和其他人听起来像她的声音(具体来说是科幻电影《她》中的 AI 助手角色)。OpenAI反驳说,它是单独委托配音的,从来没有打算或指示配音演员模仿约翰逊。

OpenAI 首席科学家兼联合创始人 Ilya Sutskever与其超级协同团队的联席负责人一起辞职,该团队致力于防范超级智能,后者在离职前批评 OpenAI优先考虑“闪亮的产品”而不是安全性。整个超级协同团队被解散。

此外,OpenAI 还因对离职员工制定了严格的非贬损性离职协议,并在违反该协议和其他条款的情况下,对股权进行追回规定而受到批评,但该公司此后表示,不会强制员工遵守该协议(我想补充一点,从我在施乐公司和自动驾驶初创公司 Argo AI 从事技术工作的经历来看,这种情况实际上并不罕见)。

然而,该公司还成功签下了主流媒体的新合作伙伴,以便在 ChatGPT 中提供训练数据和权威新闻,并且音乐家和电影制作人对其 Sora 视频生成模型产生了兴趣——据报道,好莱坞希望利用人工智能来简化电影和电视制作并降低成本。

与此同时,竞争对手谷歌因其在搜索中的人工智能概述答案而受到批评,这表明普通用户对整个人工智能领域产生了更广泛的反对。

我们将拭目以待,OpenAI 的新安全委员会是否能够在其计划推出之前安抚或至少缓解一些批评者,或许更重要的是,监管机构和潜在的商业伙伴。

这篇关于OpenAI开始训练新的前沿模型——但GPT-5至少在90天内不会推出的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1015648

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

4B参数秒杀GPT-3.5:MiniCPM 3.0惊艳登场!

​ 面壁智能 在 AI 的世界里,总有那么几个时刻让人惊叹不已。面壁智能推出的 MiniCPM 3.0,这个仅有4B参数的"小钢炮",正在以惊人的实力挑战着 GPT-3.5 这个曾经的AI巨人。 MiniCPM 3.0 MiniCPM 3.0 MiniCPM 3.0 目前的主要功能有: 长上下文功能:原生支持 32k 上下文长度,性能完美。我们引入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

90、k8s之secret+configMap

一、secret配置管理 配置管理: 加密配置:保存密码,token,其他敏感信息的k8s资源 应用配置:我们需要定制化的给应用进行配置,我们需要把定制好的配置文件同步到pod当中容器 1.1、加密配置: secret: [root@master01 ~]# kubectl get secrets ##查看加密配置[root@master01 ~]# kubectl get se