数博会 | 百度智能云千帆大模型数据安全解决方案获优秀科技成果

本文主要是介绍数博会 | 百度智能云千帆大模型数据安全解决方案获优秀科技成果,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

8月28日,由国家数据局主办、贵州省人民政府承办的2024中国国际大数据产业博览会在贵阳盛大开幕。期间,2024中国国际大数据产业博览会领先科技成果发布会在贵阳国际生态会议中心举行。百度智能云千帆大模型数据安全解决方案,凭借大模型全生命周期的数据安全高效保护,在数百个成果申报中脱颖而出,荣获数博会2024优秀科技成果。

在这里插入图片描述
2024中国国际大数据产业博览会领先科技成果发布会

2024数博会领先科技成果的评审由两位院士领衔,数十位国内互联网大数据领域的权威专家共同参与,组建评审专家委员会。评审过程严格遵循公平公正原则,按照科学性、创新性、前瞻性和引导性等评审标准进行。2024数博会领先科技成果从人工智能大模型、大数据、区块链、云计算、5G、互联网、物联网、数据安全等领域征集到的275项重大科学发现、重大理论成果中层层筛选。其中,百度安全为百度智能云千帆大模型用户打造的百度数据保险箱产品(Baidu AI Realm),提供端到端的数据密态管控与数据安全合规能力,覆盖大模型语料数据安全管理、大模型训练数据安全管控、大模型推理安全服务、大模型微调数据安全管理、大模型私有化数据资产保护等大模型全生命周期各个环节,实现“环境可信、数据可动、使用可控”的数据安全创新体验,获得数博会2024优秀科技成果的认可。

在这里插入图片描述
百度智能云千帆大模型数据安全解决方案获优秀科技成果

为积极落实《中华人民共和国数据安全法》、《工业和信息化领域数据安全管理办法(试行)》、《生成式人工智能服务管理暂行办法》等数据安全相关要求,防范大模型全生命周期各阶段相关数据安全风险,增强大模型业务开展过程中数据安全综合能力,百度数据保险箱将前沿的数据安全和隐私保护技术与大模型生态相结合,基于“数据可见不可用,数据主权可控”的原则,针对异构多云环境下,以“零信任、零改造、全流程”为理念,建立全流程密态数据围栏,确保数据在数据围栏中始终保持密文状态流通,同时基于最细粒度数据权限管控原则,通过“环境清单、数据清单、程序清单”实现进程级的数据权限动态访问控制。

在这里插入图片描述
大模型全生命周期数据安全与模型保护机制

百度数据保险箱包含三种核心能力:

1)基于文心大模型的智能分类分级:依托文心大模型强大的语义理解能力与逻辑推理能力,基于大模型的智能数据分类分级代替基于正则表达式的传统分类分级方案,实现大规模数据分类分级的自动化与智能化,极大提高数据分类分级的效率,降低数据安全合规成本,为分类分级落地实施奠定良好基础。
2)大模型数据全流程密态管理:针对大模型场景下的标注类数据、语料类数据、日志类数据,提供包括FUSE文件透明加解密、Parquet数仓透明加解密、CASB数据库透明加解密等多种加密方案,从而实现百度智能云千帆大模型数据全流程密态管理,有效管控大模型数据安全风险,避免大模型核心生产工艺和企业机密数据资产泄漏。
3)大模型运行时安全管控:对百度智能云千帆大模型平台基础环境进行数据安全风险评估形成环境清单,为大模型关键程序进行数据安全风险评估形成程序清单,为核心数据资产进行数据安全风险评估形成数据清单,同时基于零信任等数据安全管控理念,为百度智能云千帆大模型平台提供运行时安全管控机制,实现大模型在生产、流转、部署等流程中数据资产、模型资产有效保护。
在人工智能不断迭代与发展的场景下,需要使用大量数据进行模型的预训练及微调对齐。这些数据主要包括公开数据、企业自有数据、合法的外采数据、自动合成数据及人工标注数据。在模型训练时需要大量的人力、数据、机器资源,而通过这些数据训练出来的模型,既包含企业敏感信息,又是企业的核心数据资产,将是企业科技实力与核心竞争力的重要组成。但数据和模型本身,具备天然的可复制性,很容易被内部人员或外部人员窃取,从而导致数据、模型泄露等事件的发生。这不仅会导致核心数据资产的流失,还可能导致企业竞争力下降或者产生舆论事件,被通报或处罚。
百度安全持续在数据安全领域积极探索,落实端、管、云三位一体的数据安全保护理念。基于百度数据保险箱,对内可以实现高价值数据、模型资产的全链路保护,防止企业核心资产泄露;对外在数据出域、模型端侧部署等场景,可以实现数据、模型的「可见不可用,可见不可得」,保证数据、模型处于可控状态,从而实现一体化高价值数据、模型资产保护方案。以百度数据保险箱为核心提供了一整套大模型数据安全保护方案,具有进程级权限管控,实现对数据使用过程的精细化管理;利用硬件级安全可信技术,构建可信的数据处理环境;采用立体化安全防护,在数据围栏内实现密文数据的自由流动;引入自然人粒度鉴权,对全流程操作进行可信审计。通过这些能力形成了百度数据保险箱端到端的大模型数据安全生态,有效应对了数据与模型在使用、存储、流转各个环节的安全风险,为大模型产业健康发展提供了坚实保障。
百度安全将继续与行业共享技术进步成果,共同治理和验证,进一步巩固和扩大数据安全工作的成果,打造更多行业最佳实践标准和产品,帮助更多企业在数字经济建设及智能化转型中进一步释放数据要素价值。

这篇关于数博会 | 百度智能云千帆大模型数据安全解决方案获优秀科技成果的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1123257

相关文章

Golang的CSP模型简介(最新推荐)

《Golang的CSP模型简介(最新推荐)》Golang采用了CSP(CommunicatingSequentialProcesses,通信顺序进程)并发模型,通过goroutine和channe... 目录前言一、介绍1. 什么是 CSP 模型2. Goroutine3. Channel4. Channe

深入理解Redis大key的危害及解决方案

《深入理解Redis大key的危害及解决方案》本文主要介绍了深入理解Redis大key的危害及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录一、背景二、什么是大key三、大key评价标准四、大key 产生的原因与场景五、大key影响与危

Xshell远程连接失败以及解决方案

《Xshell远程连接失败以及解决方案》本文介绍了在Windows11家庭版和CentOS系统中解决Xshell无法连接远程服务器问题的步骤,在Windows11家庭版中,需要通过设置添加SSH功能并... 目录一.问题描述二.原因分析及解决办法2.1添加ssh功能2.2 在Windows中开启ssh服务2

Redis连接失败:客户端IP不在白名单中的问题分析与解决方案

《Redis连接失败:客户端IP不在白名单中的问题分析与解决方案》在现代分布式系统中,Redis作为一种高性能的内存数据库,被广泛应用于缓存、消息队列、会话存储等场景,然而,在实际使用过程中,我们可能... 目录一、问题背景二、错误分析1. 错误信息解读2. 根本原因三、解决方案1. 将客户端IP添加到Re

python 字典d[k]中key不存在的解决方案

《python字典d[k]中key不存在的解决方案》本文主要介绍了在Python中处理字典键不存在时获取默认值的两种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录defaultdict:处理找不到的键的一个选择特殊方法__missing__有时候为了方便起见,

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

Linux限制ip访问的解决方案

《Linux限制ip访问的解决方案》为了修复安全扫描中发现的漏洞,我们需要对某些服务设置访问限制,具体来说,就是要确保只有指定的内部IP地址能够访问这些服务,所以本文给大家介绍了Linux限制ip访问... 目录背景:解决方案:使用Firewalld防火墙规则验证方法深度了解防火墙逻辑应用场景与扩展背景:

SpringBoot嵌套事务详解及失效解决方案

《SpringBoot嵌套事务详解及失效解决方案》在复杂的业务场景中,嵌套事务可以帮助我们更加精细地控制数据的一致性,然而,在SpringBoot中,如果嵌套事务的配置不当,可能会导致事务不生效的问题... 目录什么是嵌套事务?嵌套事务失效的原因核心问题:嵌套事务的解决方案方案一:将嵌套事务方法提取到独立类

Spring Boot实现多数据源连接和切换的解决方案

《SpringBoot实现多数据源连接和切换的解决方案》文章介绍了在SpringBoot中实现多数据源连接和切换的几种方案,并详细描述了一个使用AbstractRoutingDataSource的实... 目录前言一、多数据源配置与切换方案二、实现步骤总结前言在 Spring Boot 中实现多数据源连接

MySQL的索引失效的原因实例及解决方案

《MySQL的索引失效的原因实例及解决方案》这篇文章主要讨论了MySQL索引失效的常见原因及其解决方案,它涵盖了数据类型不匹配、隐式转换、函数或表达式、范围查询、LIKE查询、OR条件、全表扫描、索引... 目录1. 数据类型不匹配2. 隐式转换3. 函数或表达式4. 范围查询之后的列5. like 查询6