数据应用与安全难以兼顾?华为云来解

2024-03-22 08:40

本文主要是介绍数据应用与安全难以兼顾?华为云来解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数据作为继土地、劳动力、资本、技术后的新型生产要素,是建设数字中国的重要引擎。我国高度重视数据的发展和应用,为推进数据基础制度建设,统筹数据资源整合共享和开发利用,拟组建国家数据局。数据的重要性不言而喻。

然而在数据流通应用的最后一公里,业界往往会遇到一些难题。例如,企业主体在共享数据、发挥数据价值过程中可能面临数据泄露等安全问题。机构、企业如何在数据安全、隐私保护的前提下进一步促进数据要素高效流通使用,成为了数字化转型过程中的必答题。

隐私计算:数据安全流通的关键技术

数据是企业数字化转型的基础,当企业进行数字化转型时,其实也是释放数据价值的过程。但受制于数据的高度分散性,企业往往缺乏安全有效的数据流通手段,导致“数据沉睡”和“数据孤岛”现象,很难将数据直接转化为数据资产,无法发挥数据价值。另外,由于数据本身属性较特殊,含有敏感信息的数据在不同系统间流通时往往面临数据滥用、信息泄漏等安全风险。为克服这两大难题,隐私计算应运而生。

从广义上讲,隐私计算是面向隐私保护的计算系统与技术,涵盖数据的产生、存储、计算、应用、销毁等信息流程全过程,其目的是帮助用户构建可信的数据流通价值链,让各方可以把自己的数据在自己的信任域中进行可信计算,再将结果加密汇聚起来进行整合计算,实现“数据可用不可见,可控可计量”。因此,隐私计算是当前数据流通过程中让敏感信息不泄露的有效手段,目前已广泛应用于金融、政务、医疗、能源、制造等领域。

回顾隐私计算的发展历程,可分为四个阶段:

萌芽期(1949年-1981年):1949年,劳德·香农发表论文《保密系统的通信理论》,被认为是现代密码学时代的开端。随后同态加密、秘密分享、不经意传输、多方安全计算等技术被提出,为隐私计算的发展奠定了坚实的技术基础。

探索期(1982年-1999年):混淆电路、基于密令分享的MPC、半同态加密、联邦学习等陆续出现,隐私计算的技术栈逐渐丰富,在姚期智院士解决了百万富翁不泄密比富问题后,隐私计算技术在算法层面上的可行性得到解决。

成长期(2000-2018年):随着全同态加密、联邦学习、纵向联邦学习、TEE方案框架等逐渐落地,隐私计算进入高速发展阶段。

应用期(2019年开始):隐私计算开始广泛和行业结合,逐渐落地应用。同时各国重视数据安全和个人隐私保护,陆续出台相关政策。该阶段涌现众多隐私计算厂商,不断探索应用基于隐私计算技术的数据流通产品。

据《Gartner 2022 隐私技术成熟度曲线》报告显示,预计在未来5~10年内,隐私计算技术会被大规模商业化应用。预计到2025年,60%以上的大型组织将在数据分析、商业智能或云计算中使用一种或多种隐私计算技术。在最新印发的《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)中也提到坚持数据共享共用,释放价值红利,强化优质供给,促进合规流通。可见,隐私计算不仅发展前景广阔,而且已上升至国家层面,成为数据安全流通的关键技术。

兼顾数据应用与安全,华为云TICS有最优解

自2019年起,在充分洞察市场需求、历经两年的产品迭代和严格安全合规检查之后,华为云可信智能计算服务TICS(Trusted Intelligent Computing Service)正式对外发布。

华为云可信智能计算服务TICS基于华为可信流程打造,融合了可信执行环境TEE、安全多方计算MPC、联邦学习、区块链等技术,可以有效打破数据孤岛,实现数据在流通、计算过程中全链路的安全保护和审计回溯,构建可信数据流通价值链,帮助政企等行业打造数据融合应用,安全释放数据价值。目前,该服务已通过信通院和人民银行金标委等权威机构在联邦学习、安全多方计算、可信执行环境等方向的认证,为政府、金融、消费、医疗、工业等领域提供一站式隐私计算平台,帮助找到数据应用兼顾安全的最优解。

当前隐私计算技术主要分为三大方向:第一类是以多方安全计算为代表的密码学路径;第二类是以联邦学习为代表的人工智能路径;第三类是以可信执行环境为代表的路径。为了保证数据安全和隐私性,并完成数据计算和分析,这些技术往往组合使用。

华为云可信智能计算服务TICS融合贯通这三条技术路径,因此它并不是只运用关注单一方向的技术,而是一套理论框架和技术体系,综合运用了大数据、密码学、人工智能、区块链、安全容器等多个领域的成果。

华为云TICS产品专家向CSDN介绍,TICS拥有以下优势:

一是高安全。华为在ICT领域深耕30多年,一直把“安全”视为华为公司的最高纲领和生命线。它不仅仅是一项技术,更是一种管理和设计理念,将贯穿华为产品的全流程设计当中。因此从华为云可信智能计算服务TICS设计伊始,便将“安全”放在第一位,在覆盖MPC、TEE、联邦学习、区块链等隐私保护核心技术栈的同时,将安全“左移”——即把安全程序(代码审查、分析、测试等)移动到软件开发生命周期的早期阶段,帮助防止问题产生、及时发现漏洞。此外,华为云可信智能计算服务TICS还拥有安全算法协议等,可端到端保护数据安全和隐私。

二是高性能。华为云可信智能计算服务TICS基于全生命周期的技术优势及安全协议与建模算法深度协同优化,突破了多方安全计算和联邦学习性能瓶颈,与业界相比性能提升30%左右。

三是高可用。云服务商若仅提供能力分散的隐私计算能力,远远不足以让企业应对复杂的隐私安全计算业务诉求。在企业业务场景当中,华为云可信智能计算服务TICS以业务场景匹配最佳隐私保护技术为目标,通过一站式隐私保护技术组合来匹配企业各类落地场景,推动隐私计算技术的快速落地。此外,在技术应用上,通过业界首创的基于标准SQL的多方安全计算关键技术,华为云可信智能计算服务TICS更贴近用户使用SQL的习惯,从而降低多方安全计算的开发成本。

四是规模组网和弹性扩容能力。可信数据流通好比高速货运物流,数据流动也需要数据的“高速公路”,需要庞大的数据流通基础设施,支持快速接入异构数据源,支持分布式组网,搭建超大规模的数据网络等。基于华为云体系丰富的基础设施能力,华为云可信智能计算服务TICS已具备规模的组网能力,支持弹性扩容和良好的可维护性。

值得一提的是,华为云可信智能计算服务TICS不局限于隐私计算,而是围绕隐私计算+可信交换技术,打造成一站式的可信数据流通平台,构建可信数据流通端到端解决方案。在可信交换方向,布局数据胶囊技术,实现数据的“可用、可控、可证”。在机密计算方向,与华为云擎天Enclave进行深度协同,实现“安全计算+性能加速”。在MPC方向,持续投入开源算法优化和技术自主可控,并持续提升产品安全性和易用性。

为企业数据安全流通保驾护航

2020年,被称为是隐私计算“技术元年”;2021年,为隐私计算的“应用元年”;如今,隐私计算已走向大规模落地阶段。华为云可信智能计算服务TICS通过丰富的技术积累,为企业数据安全流通保驾护航,提供数据融合应用和价值释放的最优解。

在小微企业融资场景中,银行需要在全面地对企业信用进行“精准画像”之后,方可发放信用贷款,涉及财政、税务、法院、燃气、水务、供电等数据。然而,这些数据往往分布在不同的委办局,且各委办局之间通常无法直接共享数据,需要业务员逐个进行申请、协调与沟通。信用数据共享的堵点未疏通,小微企业融资困难的问题就无法缓解。

华为云TICS可信智能计算服务通过联邦SQL和多方安全计算技术,可以对给委办局的数据实现加密协同与调用,让“数据可用不可见”,实现全流程的隐私保护。此外,华为云通过区块链技术,可以实现全流程的可视化和审计溯源,实现问题可追责。

在普惠医疗场景下,尽管当前医疗数字化水平不断提升,但医疗“数据孤岛”问题始终存在:海量的医疗健康数据分散在各医疗、社保、研究中心等机构,因受政策、法规的约束而无法得到高效流通、安全共享,难以形成合力来创造出更大的研究价值。这将阻碍医学研究、临床医疗的进步。对于诊疗水平相对低的区县医院而言,健康数据样本数更少,长此以往将造成医疗的不均衡、不公平现象。

华为云可信智能计算服务TICS助力医疗机构构建起可信数据流通的“基础设施”。通过联邦学习技术,华为云让诊疗数据不出医院,在本地分析计算后,将生成的模型参数汇聚起来,进行统一联合学习建模,即“数据不动计算动”。通过这种方式将各家医院、社康中心,还有外部合作方的样本进行统一建模,将结果反哺给各参与方,同时减少数据流通繁杂流程,降低数据使用审核成本,提高协作效率,实现普惠医疗与精准医疗。

此外,在南方某省,华为云可信智能计算服务TICS助力搭建起省级公共数据流通平台,当前已接入普惠金融、危化品监管、信用评估三大业务场景,未来预计每年约有100个单位陆续接入流通平台,实现更多业务场景落地使用。

华为云可信智能计算服务TICS产品专家表示,搭建数据流通的“基础设施”像修建高速公路一样,需要快速接入、快速运营、快速处置、快速全流程监控,保持畅通,因此基础设施搭建能力是非常重要的。华为云可信智能计算服务TICS通过搭建可信数据流通平台来解决可信交换和“原始数据可用不可见”难题,再结合华为云提供大规模基础设施搭建能力,帮助快速接入数据的“高速公路”,安全合规运输数据。

数据的汇聚和治理是实现安全可信流通的必要路径

毋庸置疑,数据安全可信流通是不仅是新时代企业高质量发展的关键,也是国家加快建设数字中国、切实保障国家数据安全的前提。值得一提的是,华为云产品专家还认为,数据的汇聚和治理是实现安全可信流通的必要路径。

回顾国内数据应用的发展历程,最开始是谁获得数据,谁就能获得价值。然而随着数据安全法律法规的逐步健全,行业对数据加工能力的要求大幅提高,最初始的野蛮开采的时代一去不返。与石油类似,如果不加以提炼,数据将无法发挥其原有的价值。

在数据治理过程中,企业面临诸多挑战,数据加工流程由数据生成及采集、数据传输、数据存储、数据使用、数据溯源与审计等环节组成,即企业需要具备对数据“采、存、算、管、用”全生命周期的管理能力,才能让高质量的数据可信流通和共享交换。

然而这些数据治理的过程中,涉及众多复杂系统架构,技术门槛较高,如果要组建相关大数据团队的话,用人成本较高。

华为云在数据领域十多年的研发与投入,已沉淀出丰富的全生命周期数据治理能力。去年,华为云推出数据治理生产线DataArts,提供一系列的工具和平台,有效帮助企业进行数据接入、数据开发、数据治理、数据资产管理、数据安全计算、数据共享、数据应用等。DataArts如一条繁忙的数据生产线,海量的数据经过它可提炼为高质量的数据,进而帮助企业实现数据驱动智能决策,充分释放数据价值。上文提到的华为云可信智能计算服务TICS是DataArts关键的组成。

另外,DataArts和华为云AI开发生产线ModelArts架构融合,彻底打通了大数据和人工智能,实现数智融合,让人工智能反哺数据 , 使得全流程实现自动化与智能化。

CSDN认为,从TICS到DataArts再到ModelArts,华为云积极创新数字技术,不断挑战和打破数据领域技术的天花板,降低数据开发和使用门槛,帮助更多企业实现数据驱动智能决策,决胜数字时代。

这篇关于数据应用与安全难以兼顾?华为云来解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/834961

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in