巴比特 | 元宇宙每日必读:证监会科技监管局局长姚前建议重点发展基于AIGC技术的合成数据产业,构建大模型训练数据的监管体系...

本文主要是介绍巴比特 | 元宇宙每日必读:证监会科技监管局局长姚前建议重点发展基于AIGC技术的合成数据产业,构建大模型训练数据的监管体系...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

60ca2694eaa72e4869f4d70afb549d17.gif

摘要:证监会科技监管局局长姚前撰文称,除算力瓶颈之外,训练数据将成为大模型产业化的最大掣肘之一。从更深层次考虑,大模型在训练数据方面还存在各种治理问题。为此,作者提出来三点建议,一是重点发展基于AIGC技术的合成数据产业,二是构建大模型训练数据的监管体系,三是探索基于可信机构或基于可信技术的数据托管方式。(中国金融杂志)

c06afe6d1700019d342221ac3bf25622.png

图片来源:由无界AI绘画工具生成。

热点资讯

苹果新专利:通过对象检测算法为用户提供定制虚拟化身服务

3 月 7 日消息,近日,美国专利商标局公布了一份苹果公司的专利申请,该专利申请涉及下一代虚拟化身/Memoji 定制,允许用户定制眼镜、帽子或其他配件,并通过机器学习过程集成到 Memoji 中。更具体地说,该专利声明“在一些实施方案中,一种或多种计算机视觉(CV)和/或其他启用机器学习(ML)的目标检测算法可应用于注册图像”。

在苹果的专利背景中,他们指出虚拟化身可以提供一定程度的隐私,同时仍然允许用户控制他们的在线身份。作为一种自我表达的手段,许多用户可能希望定制自己的化身,以显示反映用户实际外观的物理特征。用户还可以用各种配件来定制自己的化身,如服装、眼镜、头饰等,这可以反映用户的个人风格、时尚品味和/或现实生活中的外观。

微软将ChatGPT整合到更多工具中,不用写代码就能开发应用

3 月 7 日,据新浪科技报道,微软公司将 ChatGPT 背后的技术整合到其 Power Platform 平台上,允许用户在几乎不需要编码的情况下,就能开发自己的应用程序。微软表示,其 Power Platform 平台上的一系列商业智能和应用程序开发工具,包括 Power 虚拟代理(Power Virtual Agent)和 AI Builder,均已更新 ChatGPT 功能。Power 虚拟代理是一款供企业构建聊天机器人的工具,如今可以连接到公司内部资源,生成周报和客户查询的摘要。此外,微软还为 AI Builder 和 Dynamic 365 添加了 ChatGPT 技术,前者允许企业自动执行工作流程,后者是一个业务管理平台。

美 SEC 正增加员工人数,重点调查 DeFi 平台、NFT 和稳定币等违反证券法的行为

据福布斯 3 月 7 日报道,美国证券交易委员会(SEC)正在增加员工人数,增强审查、调查、审计、检查和可能起诉与这些新加密产品和交易活动相关的证券法违法行为的能力。新增的工作人员将包括监管人员、调查人员律师、欺诈分析师和出庭律师,重点调查以下方面违反证券法的行为:加密资产发行、交易以及借贷和质押产品;DeFi 平台;NFT 和稳定币。

市场调查机构:英伟达可从 ChatGPT 赚取 3 亿美元

3 月 7 日,市场调查机构 TrendForce 集邦咨询公布的最新报告指出,如果以英伟达 A100 显卡的处理能力计算,运行 ChatGPT 将需要使用到 30000 块英伟达 GPU。目前英伟达 A100 显卡的售价在 10000-15000 美元之间,该售价取决于 OpenAI 需要多少显卡,以及英伟达是否会为 AI 公司提供订单折扣。TrendForce 预估英伟达可以赚取超过 3 亿美元。

外媒:亚马逊预计将于 4 月 24 日推出 NFT 平台

据 Thebigwhale 报道,电商巨头亚马逊预计将于 4 月 24 日推出其 NFT 平台,此次发布将推出约 15 个系列。此前据 Blockworks 报道,四位消息人士称,亚马逊正在推出一个数字资产企业,NFT 计划预计将在春季推出。

元宇宙荐读

《姚前:ChatGPT类大模型训练数据的托管与治理》

ChatGPT的主要魅力在于,它利用从互联网获取的海量训练数据开展深度学习和强化学习,可以给用户带来全新的“人机对话”体验。海量训练数据可谓是维系ChatGPT进化的核心要素之一。有研究预测,按照目前的发展速度,到2026年ChatGPT类大模型的训练将耗尽互联网上的可用文本数据,届时将没有新的训练数据可供使用。因此,算力瓶颈之外,训练数据将成为大模型产业化的最大掣肘之一。

https://www.8btc.com/article/6807648

《投资者:AIGC是现阶段重点投资领域,整体乐观,但出手谨慎》

AIGC看了有半年了,到现在为止都没看到合适的项目。”聊起近来的投资方向,一名北京的投资人冯奇(化名)略显遗憾地告诉《科创板日报》记者。冯奇说,他所在的机构从去年stable diffusion开源以后,就一直在关注AIGC领域,尤其在ChatGPT出现之后,对于生成式AI,大家基本形成了共识,“这是一个重要的、有机会的市场”。

https://www.8btc.com/article/6807594‌

《Meta版ChatGPT开源代码遭泄漏,开发者称新 AI 大模型推理速度优于GPT》

3月5日,一位名为@Enryu 的开发者在Medium平台发文,比较了LLaMA和ChatGPT在多个开发挑战任务中的效果。结果显示,LLaMA训练过程算法大部分比ChatGPT训练更快、更便宜。他认为,与ChatGPT相比,LLaMA架构更小,但训练过程和单GPU(图形处理器)芯片推理速度更快,成本更低,而且该库还支持所有LLaMA模型架构,用户可对模型进行微调等。

https://www.8btc.com/article/6807678‌

巴比特园区开放合作啦!

b037057fd9d3106d74683974a1b88271.png

000dcf35579864b6ef18d047a75ced17.jpeg

fba462a5df6e65a3eb9594b9bda0e73c.gif

中文推特:https://twitter.com/8BTC_OFFICIAL

英文推特:https://twitter.com/btcinchina

Discord社区:https://discord.gg/defidao

电报频道:https://t.me/Mute_8btc

电报社区:https://t.me/news_8btc

8e8ea5020cb50593cfe8c98d95e08f7c.jpeg

这篇关于巴比特 | 元宇宙每日必读:证监会科技监管局局长姚前建议重点发展基于AIGC技术的合成数据产业,构建大模型训练数据的监管体系...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/670925

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

跨国公司撤出在华研发中心的启示:中国IT产业的挑战与机遇

近日,IBM中国宣布撤出在华的两大研发中心,这一决定在IT行业引发了广泛的讨论和关注。跨国公司在华研发中心的撤出,不仅对众多IT从业者的职业发展带来了直接的冲击,也引发了人们对全球化背景下中国IT产业竞争力和未来发展方向的深思。面对这一突如其来的变化,我们应如何看待跨国公司的决策?中国IT人才又该如何应对?中国IT产业将何去何从?本文将围绕这些问题展开探讨。 跨国公司撤出的背景与

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi